ChatGPT 使用 拓展资料:吴恩达大咖 Building Systems with the ChatGPT API 系统评估1
在前面的几段视频中,用户展示了如何使用一个小时来构建应用程序,从评估这些输入到处理输入,再到进行最终打开检查,再到向用户显示输出。显然是构建了这样一个系统。
你怎么知道它是如何工作的?也许即使你部署了它并让用户使用它,你如何跟踪进展情况并找到这些不足之处,并继续提高系统中答案的质量?在这个视频中,我想和大家分享一些评估Elm输出的最佳实践。
我想具体地向大家展示构建其中一个系统的。你在这段视频中听到我谈论的内容,和你在更传统的仅受机器学习监督的应用程序中看到的内容之间的一个关键区别是,你可以如此快速地构建这样一个应用程序评估它,往往不会从一个测试集开始。
- 相反,你通常最终会逐步构建一组测试示例。你可能还记得第二个视频中的这张图,关于问题开发如何加快多重开发的核心部分,从几个月到几分钟或几小时。不管怎样,人们都会举出一些例子,那么收集其他1000个测试例子的增量成本也没那么糟糕。
- 因此,在传统的监控学习环境中,点击一个训练网站、收集一个开发集或在一个测试集中,持有交叉验证集并不罕见,然后在整个开发过程中使用手头的工具。
- 但是,如果你能够在几分钟内指定一个提示,并在几个小时内完成一些工作,那么如果你不得不