ESPNet代码结构(Recipe) 文件结构介绍 图中表示ESPNet的文件目录结构 在corpus-name下,任务文件夹enh1表示用于语音增强任务(单人增强,多人分离) conf表示模型训练和推理时用到的配置文件 local表示与该语音数据集相关的准备脚本 data表示在代码运行过程中产生的Kaldi格式的运行文件 dump表示对data目录中内容进行进一步处理后得到的数据文件 exp存放实验相关的文件 enh.sh模板脚本 2023-07-23 学习 #语音 #ESPNet
Arch/Manjaro系统ssh断开后tmux会话中断的问题 问题 系统:Manjaro或Arch 桌面系统:Gnome(万恶之源) 描述:通过SSH连接到Manjaro上并开启tmux会话,每次在tmux detach后也认真tmux ls发现session保存才敢下线,但是发现ssh log out后所有的session都没有被保存下来。 其实是一个经历许久的问题,应该是遇到相同问题的人不太多,今天终于花时间找到了解决方案。 解决方案 原帖在这里,大家不 2023-06-20 技术 #tmux #Manjaro #Linux #SSH #网络
使用Surge开启SSH代理无法通过私钥连接的原因 问题 SSH代理 如果不通过密码开启SSH代理就必须使用私钥,使用RSA私钥可以通过ssh连接服务器,但是在Surge设置后出现了ssh authorazition failed的情况,测试代理不通。 解决 结论放在前面:RSA密钥加密方式不对,更换到ed25519加密方式重新生成密钥 Surge的SSH代理相当于ssh -D命令,开启动态端口转发功能。 如果用的是dropbear这种非op 2023-05-23 技术 #SSH #网络 #Surge #代理
在Linux上无sudo安装使用ProxyChains 前言 多人共用服务器时经常遇到分配的账户无sudo权限、无法提权,但是经常需要安装软件。 通常来讲下载源码本地make然后install没有太多问题,不过由于很多软件开发者设置的路径问题会导致软件无法使用, 本文以ProxyChains为例进行整个过程,ProxyChains是一个全局代理工具,可以在需要的命令前加上proxychains4使得该命令按照设置通过代理访问。 注意这个工具只能代理TC 2023-04-18 技术 #代理 #proxy #tool #linux
Github Pages与Hexo deploy的一点小问题 前情提要 顺便如果你还没撸过这个学生党羊毛:https://education.github.com/pack/offers 一共有三家域名商给提供这个羊毛,慢慢撸 前段时间想玩玩域名,于是趁着GitHub学生包还在赶紧撸两个免费的一年域名。简单的注册域名绑定在GitHub Pages上之后就没有再deploy到仓库上新的博文,只是在本地修改过,于是忘记了有这么一回事。 namecheap这家 2023-04-16 技术 #hexo #博客 #git
微调Bert模型完成文本分类feat.fastNLP Fine-tuned Bert for TextClassification 前言 文本分类也是NLP领域的传统任务,在Bert模型的加持下可以轻松达到较高的准确率,相比之前的NER任务从数据到模型上都要简单。 如果直接手写训练函数,可以在模型上调用huggingface的BertForSequenceClassification类,它是在BertModel的后面接上dropout和一层分类头,直 2023-03-31 学习 #Bert #NLP #文本分类
使用BERTopic提取文本主题 使用BERTopic提取文本主题 加载数据集 挂载Google Drive用于读取数据集,这里会要求登陆Google账号授权,每次都需要重新授权,建议一开始在colab中选好gpu分配资源。 12from google.colab import drivedrive.mount('/content/drive') 数据集来自外卖平台中文评论,数据集地址:https://raw. 2023-03-28 学习 #Bert #NLP #BERTopic #文本主题
使用Bert进行NER命名实体识别feat.fastNLP(下:使用flask部署模型) 前言 下篇主要介绍使用flask搭建简单的网页和响应,并实现调用模型推理,完成NER任务可视化。 增加bilstm+crf的模型确实在预测上更为准确,例子中的“崔永元真面”中可以准确分辨出"崔永元"才是人名,而mlp模型会将“崔永元真”作为一个人名🤣 项目工程的Github仓库地址为:https://github.com/Ash-one/ChineseBert-finetuned-NER 2023-03-25 学习 #python #Bert #NLP #NER #flask
使用Bert进行中文NER命名实体识别feat.fastNLP(上:模型篇) 前言 项目工程地址:https://github.com/Ash-one/ChineseBert-finetuned-NER chatGPT的大火让很多NLP工作者的研究都陷入僵局,NER这种传统任务对于这种LLM已经可以说是小菜一碟。 NewBing进行ner 虽然没能力搞个GPT出来,搞个简单的Bert微调还是可以做到的。 本文对于NER命名实体识别任务,使用复旦大学的fastNLP 2023-03-18 学习 #Bert #NLP #NER
富有表现力的语音合成系统(Expressive TTS) 富有表现力的语音合成系统 Tacotron-GST 在Tacotron引入了全局风格标签(Global Style Token,GST)。模型包括reference encoder,style attention,style embedding Tacotron-GST模型结构 StyleToken-TTS 在数据集上增加风格标签,代表话语风格的短语或词,例如情感、意图和语调。由于风格是用自 2023-02-10 学习 #语音合成 #论文
VALL-E VALL-E 模型 使用60k小时英语语音训练,使得模型出现上下文学习能力。只需要3秒特定录音,就可以学习到说话人的说话方式,甚至是背景音。 demo演示:https://valle-demo.github.io/ 模型总览 音频量化 Speech Quantization 对于常见的一秒音频,16位,48kHz,意味着需要每个step有\(2^{16}=65536\)个值,整个序列长度接近 2023-01-13 学习 #语音合成
《声与情:播音用声的实证研究》笔记 链接:https://www.zhizhen.com/detail_38502727e7500f26ca5684ae8f3c3b6429bcb36a14c533e11921b0a3ea25510134114c969f2eae5c9837344477b6470412f90171de0b6360e6b1c5d917c82372d97823f6a9338067eed855d3fbe548a5?& 2022-11-03