对话Agent,通义千问基础语言模型进展!

261未经授权,禁止转载
大模型阿里云Agent多模态自然语言处理大型语言模型多模态学习预训练模型模型微调角色扮演指令跟随知识增强功能调用视觉语言模型
本次分享聚焦于大型语言模型(LLM)在各行各业的应用,并探讨了如何提升模型在下游任务中的基础能力。从2020年开始,研究团队开发了多模态大模型,并逐步发展到百亿参数规模的模型,关注于使用更少资源提升性能。2022年,提出了"one for all"模型概念,集中处理多任务,尽管泛化性存在挑战。ChatGPT的成功启发了研究团队,推动了基于此的更强大语言模型的开发。目前,已发布从3B至1000B参数规模的模型,并在性能、序列长度、角色扮演、知识增强等方面进行了优化。此外,分享还涵盖了开源工作、模型性能、系统增强、IG能力、工具调用和多模态模型等方面的进展,适合对自然语言处理、机器学习和人工智能领域的研究者和技术开发者。
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
ad
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
讲师头像
Datawhale
Datawhale 是一个专注于数据科学与 AI 领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale 以「for the learner,和学习者一起成长」为使命,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人、人与知识、人与企业和人与未来的联结。
TA的视频
接下来播放:
自动连播