QQ浏览器视频搜索中的多模态技术

914 未经授权,禁止转载了解课程
课程介绍
讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}
适合人群
技术团队负责人、架构师、总监、开发人员,以及对技术感兴趣的企业家、创业者和相关人士。
你将会学到
封面视觉匹配技术演化; 视频内容帧匹配技术演化;ocr/asr引入的演化路径;
课程简介

演讲简介:
移动互联网生态下,用户越来越习惯消费视频资源,视频资源的生产数量也在明显变多。视频作为一个包含文本、封面、视频帧、音频等各种模态的综合载体,在搜索引擎中相比于图文网页带来更大的困难挑战。同时多模态技术也在近些年变成了关注的热点。
本次分享着重于视频搜索中多模态匹配、多模态融合技术在QQ浏览器视频搜索中的实践应用。

大纲:
1.背景
1) QQ浏览器搜索、视频搜索介绍;
2) 多模态技术在视频搜索中的位置与重要性;
3) 多模态技术面临的难点与挑战;
2.关键技术
1)目标介绍;
2)封面视觉匹配技术演化;
3)视频内容帧匹配技术演化;
4)ocr/asr引入的演化路径;
5)多模态融合的演化;
3.后续技术展望

演讲人介绍:
本科就读于西安交通大学计算机系,研究生毕业于中国科学技术大学,毕业后加入百度搜索算法部,后加入腾讯PCG搜索应用部,负责QQ浏览器内视频搜索业务。在搜索排序、点击、多模态、NLP文本分类等方面,有多年经验积累。

展开更多
发布
头像

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记
讨论图
{{ item.create_time }}回复
  • 删除

    是否确认删除?

    确认
    取消
  • {{ item.is_top == 1 ? '取消置顶' : '置顶'}}

    已有置顶的讨论,是否替换已有的置顶?

    确认
    取消
{{ tag.text}}
头像
{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}
{{ subitem.create_time }}回复
删除

是否确认删除?

确认
取消
发布
{{pageType === 'video' ? '讨论区抢占沙发,可获得双倍学分' :'讨论区空空如也,你来讲两句~'}}
发布
{{tips.text}}
{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}
{{ hasMyNote ? '我的笔记' : '记笔记' }}
优质笔记
更新于:{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}
头像
{{ detail.username }}

公开笔记对他人可见,有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记
保存
提问

讲师收到你的提问会尽快为你解答。若选择公开提问,可以获得更多学员的帮助。

记录时间点
记录提问时视频播放的时间点,便于后续查看
公开提问
提交