BOB平台登录

体育彩票bobapp

Guide

BOB平台登录:AI 产品工作流梳理

2022-06-07 06:30:30 | 来源:bobsports 作者:体育彩票bobapp

  下图是一个 AI 产品的大概框架。这里面关键的认知是,AI 能力迭代是跟产品功能迭代平行的、一条需要基于反馈不断迭代的一个子工作流。

  基于两者是平行的流程,我们可以借鉴产品经理的工作流,对 AI 产研的工作流程进行拆解和构建。下面,我们来看一下每个流程中 AI 产研应该关注的问题。

  不同的场景对于 AI 的需求是不一样的。比如在于指尖查词项目中,我们需要了解用户在使用智能硬件产品时的灯光环境,这个涉及到我们对于算法训练集的选择。

  另外,有些摄像头会在不同的光线之下自动做白平衡,这会导致最后出来的图像差异非常大,这些都会导致最后算法的准确率很差。

  我们需要了解用户在某个场景下的问题,然后分析 AI 对此问题能否有效(提升效率、降低成本、提升体验)。

  比如词典里面的单词音标,目的是教小朋友学习发音,但是低年级的小朋友是没有学到音标的。所以这些学生要有标准的发音进行引导,除此之外,还需要有发音的口型教学内容。基于计算机视觉的 AI 能力,类似有道词典笔的产品可以大幅提升查找效率,这是整个产品能够成立的关键。

  除了验证 AI 能否有效以外,我们还需要知道我们的 AI 是否可行。比如在指尖查词项目中,我们就需要知道用户对于 AI 的要求,比如以下指标:

  很多前沿技术虽然还没有被大规模投入使用,但是已经能产出很多 demo 了。寻找这一类的竞品,我觉得可以在 github 上面找到。

  比如,我跟算法同学聊了指尖的轨迹跟踪,立马丢给我一个 github 的轨迹跟踪的项目 deepsort。

  这一类可以从 AI 平台找到,比如百度、华为、阿里、腾讯这种 AI 大厂的开放平台,就展示各种已经成熟的 AI 能力,以及成功案例。

  在算法同学进行算法设计时,我们 AI 产品需要知道算法,这样有利于我们进行产品设计,我觉得以下两个是一个好的切入点。

  比如在指尖查词项目中,如果在客户端部署了指尖检测的算法,我们就可以在检测到指尖时,给予用户及时的状态反馈,而不用等到整个文字识别结果返回才给到反馈。

  比如我们看了百度 OCR 的接口文档,我们发现 AI 能够识别文字的角度。基于这个能力,我们可以在发现用户书本方向放错时,给予用户及时的反馈。

  在需求文档这块,除了传统的需求文档模块之外,AI 产品(计算机视觉产品)可能需要需要在以下几个层面进行深入。

  由于算法在早期的效果是不够理想的,所以我们要界定一些超出 AI 能力的异常情况,也就是黑话 兜底 。

  比如计算机视觉中一直没有返回图像识别结果,对话机器人中一直无法判断用户是否说完话或者用户意图,等等。大部分的兜底策略就是用开玩笑的口吻回应用户,比如 这个单词还没学会 、 这个技能还要再练习 。

  算法最终会达到一个正向循环,即上线后拿到用户数据,对这些数据标注后,训练算法,提升算法性能,然后会有更好的体验,会有更多的用户使用,接着拿到更多的用户数据,走向正循环。

  但是刚开始的时候,没有大量数据进行训练的时候,算法性能是不高的,需要慢慢达到正循环,再次之前的过程,我理解为算法的冷启动。

  如果我们是接入百度、华为等大平台的 AI 能力,那冷启动的过程相对来说要快很多,但是一个要注意的问题是大平台的服务相对来说是通用的,可能对于我们自己的垂直场景没有做过优化,估计数据表现也不会很好。

  我们知道算法的精准度等指标刚开始是不理想的,尤其是在自研的情况下,我们需要让用户先用起来,然后收集数据之后,再进行训练和迭代。

  其实这个跟产品的 MVP 很像,刚开始发布的第一个版本,也不是一个完美的版本,需要用户用起来之后进行迭代才行。

  但是在冷启动的时候,要考虑场景的容错性。比如自动驾驶领域,可能对于计算机视觉的能力要求非常高,出错了会造成乘客的生命危险,这个场景的容错性是很低的,所以这种产品内部要做很多测试,达到较高的标准之后,才能发布给用户体验。

  但是,对于很多场景容错性相对较高,比如娱乐游戏场景,则标准比较低,可以尽快上线,接受用户的反馈。

  我在做指尖查词的产品过程中,跟着算法工程师一起把算法的准确率从 70%+ 提升到了 90%+,可以分享一下整个过程。

  更具体而言,整个测试集样本中,有 12% 的样本是指尖识别坐标错误,有 6% 是因为文字识别错误,所以我们第一个版本的准确率大概只有 70% 左右。

  主要理由是,算法同学判断指尖附近内容的方法存在问题。优化之后,后面几乎没有坐标识别错误,正确率一下子提升了 12% 个点。

  经过一个周期的努力,我们把算法的准确率从 70%+ 提升到了 90%+,用户的体验有了质的提升。

  早期算法还不是很厉害的时候,我们需要主动做一些用户体验管理。我觉得可以从以下几个层面进行管理:

  基于我们场景的容错率,我们的产品要在满足用户的最低要求后,才能给到他们使用。发布之后,最好也要进行预期管理,告知目前哪些场景可以支持,准确率怎么样,哪些又不能支持,希望能够给到用户合理的预期。

  比如指尖查词场景里面,当算法不确定用户是指哪一个单词时,我们可以把两个相近的两个单词都给出来,方便用户进行挑选。

  某些场景我们的算法确实搞错了,则可以留一个入口给到用户。一方面给到用户一个宣泄的渠道,另外一方面也可以作为一个样本给到我们去判断底层的问题。

  比如,我们的 OCR 识别还不识别手写体,则用户拿手写体过来时,则要告知用户不支持手写体,不然用户会很有挫败感,类似还有:

  不能把所有的体验问题都归咎于 AI 算法,比如在识别过程中的耗时问题,除了 AI 算法可能存在问题外,我们的 app 可能在摄像头打开、识别结果数据库对比等环节都存在耗时过多的问题。

上一篇:合见工软发布多款EDA产品和解决方案 下一篇:2022爱分析 中国分析型数据库市场研究报告 爱分析报告
ABUIABACGAAgpbzOxQUowOv07gIwZThl

关注微信公众号