使用Surge开启SSH代理无法通过私钥连接的原因 问题 SSH代理 如果不通过密码开启SSH代理就必须使用私钥,使用RSA私钥可以通过ssh连接服务器,但是在Surge设置后出现了ssh authorazition failed的情况,测试代理不通。 解决 结论放在前面:RSA密钥加密方式不对,更换到ed25519加密方式重新生成密钥 Surge的SSH代理相当于ssh -D命令,开启动态端口转发功能。 如果用的是dropbear这种非op 2023-05-23 技术 #SSH #网络 #Surge #代理
在Linux上无sudo安装使用ProxyChains 前言 多人共用服务器时经常遇到分配的账户无sudo权限、无法提权,但是经常需要安装软件。 通常来讲下载源码本地make然后install没有太多问题,不过由于很多软件开发者设置的路径问题会导致软件无法使用, 本文以ProxyChains为例进行整个过程,ProxyChains是一个全局代理工具,可以在需要的命令前加上proxychains4使得该命令按照设置通过代理访问。 注意这个工具只能代理TC 2023-04-18 技术 #代理 #proxy #tool #linux
Github Pages与Hexo deploy的一点小问题 前情提要 顺便如果你还没撸过这个学生党羊毛:https://education.github.com/pack/offers 一共有三家域名商给提供这个羊毛,慢慢撸 前段时间想玩玩域名,于是趁着GitHub学生包还在赶紧撸两个免费的一年域名。简单的注册域名绑定在GitHub Pages上之后就没有再deploy到仓库上新的博文,只是在本地修改过,于是忘记了有这么一回事。 namecheap这家 2023-04-16 技术 #hexo #博客 #git
微调Bert模型完成文本分类feat.fastNLP Fine-tuned Bert for TextClassification 前言 文本分类也是NLP领域的传统任务,在Bert模型的加持下可以轻松达到较高的准确率,相比之前的NER任务从数据到模型上都要简单。 如果直接手写训练函数,可以在模型上调用huggingface的BertForSequenceClassification类,它是在BertModel的后面接上dropout和一层分类头,直 2023-03-31 学习 #Bert #NLP #文本分类
使用BERTopic提取文本主题 使用BERTopic提取文本主题 加载数据集 挂载Google Drive用于读取数据集,这里会要求登陆Google账号授权,每次都需要重新授权,建议一开始在colab中选好gpu分配资源。 12from google.colab import drivedrive.mount('/content/drive') 数据集来自外卖平台中文评论,数据集地址:https://raw. 2023-03-28 学习 #Bert #NLP #BERTopic #文本主题
使用Bert进行NER命名实体识别feat.fastNLP(下:使用flask部署模型) 前言 下篇主要介绍使用flask搭建简单的网页和响应,并实现调用模型推理,完成NER任务可视化。 增加bilstm+crf的模型确实在预测上更为准确,例子中的“崔永元真面”中可以准确分辨出"崔永元"才是人名,而mlp模型会将“崔永元真”作为一个人名🤣 项目工程的Github仓库地址为:https://github.com/Ash-one/ChineseBert-finetuned-NER 2023-03-25 学习 #python #Bert #NLP #NER #flask
使用Bert进行中文NER命名实体识别feat.fastNLP(上:模型篇) 前言 项目工程地址:https://github.com/Ash-one/ChineseBert-finetuned-NER chatGPT的大火让很多NLP工作者的研究都陷入僵局,NER这种传统任务对于这种LLM已经可以说是小菜一碟。 NewBing进行ner 虽然没能力搞个GPT出来,搞个简单的Bert微调还是可以做到的。 本文对于NER命名实体识别任务,使用复旦大学的fastNLP 2023-03-18 学习 #Bert #NLP #NER
富有表现力的语音合成系统(Expressive TTS) 富有表现力的语音合成系统 Tacotron-GST 在Tacotron引入了全局风格标签(Global Style Token,GST)。模型包括reference encoder,style attention,style embedding Tacotron-GST模型结构 StyleToken-TTS 在数据集上增加风格标签,代表话语风格的短语或词,例如情感、意图和语调。由于风格是用自 2023-02-10 学习 #语音合成 #论文
VALL-E VALL-E 模型 使用60k小时英语语音训练,使得模型出现上下文学习能力。只需要3秒特定录音,就可以学习到说话人的说话方式,甚至是背景音。 demo演示:https://valle-demo.github.io/ 模型总览 音频量化 Speech Quantization 对于常见的一秒音频,16位,48kHz,意味着需要每个step有\(2^{16}=65536\)个值,整个序列长度接近 2023-01-13 学习 #语音合成
《声与情:播音用声的实证研究》笔记 链接:https://www.zhizhen.com/detail_38502727e7500f26ca5684ae8f3c3b6429bcb36a14c533e11921b0a3ea25510134114c969f2eae5c9837344477b6470412f90171de0b6360e6b1c5d917c82372d97823f6a9338067eed855d3fbe548a5?& 2022-11-03
使用中转服务器代理访问内网bySSinDocker 目的 通过常用的代理软件(小火箭)连接到处于内网环境的代理服务器,从而实现在任意地方访问内网的需求,进而可以使用内网跳板机连接其他内网机器,突破SSL会话限制。 在外网可以使用代理服务器访问内网服务 搭建步骤 概览 为方便快捷,使用docker在内网中部署shadowsocks服务器,放出端口 为从外部访问内网,使用docker部署frpc监听ss服务器端口,连接带有公网IP的frps 终 2022-10-27 技术 #网络 #代理
虚拟局域网技术VLAN解析 虚拟局域网技术 ## 前言 工作在数据链路层的以太网交换机由于以太网规模的扩大导致广播域扩大,造成的广播风暴可能会导致网络瘫痪。 广播信息的来源主要是涉及到地址解析、名称解析的行为: 网络层 TCP/IP协议栈中的协议:地址解析协议ARP,路由信息协议RIP,DHCP 会话层协议:网上基本输入输出系统NETBIOS 应用层协议:链路本地多播名称解析LLMNR 网络中的广播信息无处不在,想要克制 2022-10-17