吴恩达课程《基于langChain的LLM应用开发》6-evaluating

912未经授权，禁止转载

{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }} {{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }} {{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}

提问 {{ interaction.noteNum > 0 ? interaction.noteNum + '篇笔记' : '记笔记' }} 离线观看

下载学堂APP

缓存视频离线看

报告问题离线观看

下载学堂APP

缓存视频离线看

视频讨论了评估基于语言模型（LOM）构建的复杂应用程序的方法。提到了评估应用精准度的必要性，考量改变仪器或策略后对性能的影响。介绍了用于评估的工具和框架，强调了理解数据输入输出的重要性，并提出使用语言模型自我评估的创新方法。视频还深入探索了链式调试，使开发人员能够通过多点分析来了解模型的表现，同时涉及了自动生成查询、答案对和预测评估的方法，最后介绍了一种可视化UI评估平台，能够存储和展示评估过程。内容针对那些熟悉机器学习、特别是自然语言处理和模型评估流程的技术专业人士。

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

发布

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记

讨论图

{{ item.create_time }}{{ Number(item.like_count) || '' }}回复

删除
是否确认删除?
确认
取消
{{ item.is_top == 1 ? '取消置顶' : '置顶'}}
已有置顶的讨论，是否替换已有的置顶？
确认
取消

{{ tag.text}}

{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}

{{ subitem.create_time }}{{ Number(subitem.like_count) || '' }}回复

删除

点击查看更多收起

发布

{{pageType === 'video' ? '讨论区抢占沙发，可获得双倍学分' :'讨论区空空如也，你来讲两句~'}}

发布

{{tips.text}}

{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ item.username }}

优质笔记

更新于：{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}

{{ detail.username }}

公开笔记对他人可见，有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记

保存

讲师头像

acedar

电子科技大学硕士，精通NLP算法及大模型算法及应用，包括RAG及Agent等。现任职于腾讯高级研究员，具有7年以上的大型项目开发经验。研究领域涵盖人工智能，AIGC，NLP算法。申请专利近30项，曾多次参加腾格里沙漠植树及AI教学等公益活动，在2022年被评为优秀共产党员，荣获《2022年度深圳市产业发展与创新人才奖》。出过《手把手带你从0到1实现大模型agent》《手把手教你实现大模型RAG》《ChatGLM微调原理和源码分析》《chatglm原理介绍及源码剖析系列课程》《langchain源码剖析系列课程》等课程。

接下来播放：

自动连播

python基础

196345人学习

创客官方账号

ROS机器人开发2.1 视频教程

ROS机器人开发2.1 视频教程

129479人学习

ROS机器人开发1.1 视频教程

ROS机器人开发1.1 视频教程

程序员开启财富之门-量化金融技术入门篇

程序员开启财富之门-量化金融技术入门篇

做一个懂金融的程序员—金融量化分析入门系列视频课程

做一个懂金融的程序员—金融量化分析入门系列视频课程

人工智能-数学基础视频课程

人工智能-数学基础视频课程

机器学习-推荐系统实战视频课程【唐宇迪】

机器学习-推荐系统实战视频课程【唐宇迪】

程序员开启财富之门-量化交易实战体系提高篇视频课程

程序员开启财富之门-量化交易实战体系提高篇视频课程