【Whalepaper第22期】NLP分享：MixText？拿来吧你！

299未经授权，禁止转载

{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }} {{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }} {{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}

提问 {{ interaction.noteNum > 0 ? interaction.noteNum + '篇笔记' : '记笔记' }} 离线观看

下载学堂APP

缓存视频离线看

报告问题离线观看

下载学堂APP

缓存视频离线看

本次分享聚焦于KDD2020年的一篇论文，该论文提出了一种新颖的半监督学习方法，用于文本分类（LP）领域的数据增强。论文中提到的技术亮点包括借鉴图像分类中的数据增强方法，通过模型融合生成新的训练样本，以及结合传统LP领域的数据增强技术。这种方法不仅打通了有监督与无监督学习的信息壁垒，而且充分利用了未标注数据，提高了模型的训练效果。尽管损失函数部分存在一些疑问，但整体上，该方法在多个数据集上表现出了显著的性能提升，适合对半监督学习和数据增强技术感兴趣的研究者和技术开发者学习。

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

发布

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记

讨论图

{{ item.create_time }}{{ Number(item.like_count) || '' }}回复

删除
是否确认删除?
确认
取消
{{ item.is_top == 1 ? '取消置顶' : '置顶'}}
已有置顶的讨论，是否替换已有的置顶？
确认
取消

{{ tag.text}}

{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}

{{ subitem.create_time }}{{ Number(subitem.like_count) || '' }}回复

删除

点击查看更多收起

发布

{{pageType === 'video' ? '讨论区抢占沙发，可获得双倍学分' :'讨论区空空如也，你来讲两句~'}}

发布

{{tips.text}}

{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ item.username }}

优质笔记

更新于：{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}

{{ detail.username }}

公开笔记对他人可见，有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记

保存

讲师头像

Datawhale

Datawhale 是一个专注于数据科学与 AI 领域的开源组织，汇集了众多领域院校和知名企业的优秀学习者，聚合了一群有开源精神和探索精神的团队成员。Datawhale 以「for the learner，和学习者一起成长」为使命，鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案，赋能人才培养，助力人才成长，建立起人与人、人与知识、人与企业和人与未来的联结。

接下来播放：

自动连播

AIGC与NLP大模型实战-经典CV与NLP大模型及其下游应用任务实现

AIGC与NLP大模型实战-经典CV与NLP大模型及其下游应用任务实现

Pytorch框架与经典卷积神经网络与实战

Pytorch框架与经典卷积神经网络与实战

炮哥带你学

LLama实战本地CPU推理大语言模型-C++开发实战

LLama实战本地CPU推理大语言模型-C++开发实战

Pytorch框架：自然语言处理入门及实战

Pytorch框架：自然语言处理入门及实战

Llama3大模型原理代码精讲与部署微调评估实战

Llama3大模型原理代码精讲与部署微调评估实战

Transformer原理与代码精讲

Transformer原理与代码精讲

Swin Transformer实战实例分割：训练自己的数据集

Swin Transformer实战实例分割：训练自己的数据集

Swin Transformer原理与代码精讲

Swin Transformer原理与代码精讲