买木地板的朋友也许还不知道,以往厂家对木地板上的虫眼、结痂等,得靠人工检视来处理,效率较低。而现在,通过人工智能训练模型和SDK植入摄像头,实现了针对虫眼、结痂的自动识别,实际测试识别准确率达到95%以上,1秒内可完成瑕疵识别过程,仅检测环节效率便提高了将近%。
像这样的制造业原料筛选工业级方案,背后所使用技术就涉及到百度AI开放平台旗下的EasyDL。对于很多中小创业企业和开发者来说,如果能借助巨头的AI能力,无疑能推动产品快速落地。
5月25日,“燎原计划”暨百度AI开发者实战营第二季来到成都。围绕百度AI开放平台,百度资深AI工程师为成都开发者带来了详细讲解。与去年一样,今年的实战营现场依然“十分火爆”,数百名成都人工智能创业者、开发者、技术爱好者、投资者齐聚现场,在正式开始前,现场就已座无虚席。
百度AI技术生态部总经理喻友平系统介绍,目前百度对外开放技术能力已超过个,接入开发者与合作伙伴超过50万,覆盖了20多个行业,共有45家企业进入百度AI加速器。通过开放的API、SDK的方式,开发者可以快速上手使用百度的AI技术。
从人脸识别技术、语音技术到语义技术、视觉技术、人体分析技术,如今,百度已经永久免费开放从感知到认知的最常用AI技术。
在成都站现场,百度就正式发布了百度自定义模板文字识别,解决用户在文字识别业务中存在的大量结构化识别需求,并宣布文字识别服务进一步免费升级。
此外,百度正式发布呼叫中心语音识别,这是专门为呼叫中心场景打造的识别模型,将满足呼叫中心的不同场景需求。比如实时语音识别支持百毫秒级别实时通话转文字,适用于实时通话质检、智能外呼、IVR等场景。
喻友平也透露了百度AI开放平台正在规划的一些技术能力,比如在图像识别领域,百度即将开放食材识别、地标识别、服饰识别、看图说话等技术。比如,百度也将陆续开放图像处理与增强技术,包括图像无损放大、去模糊、去雾、对比度增强、去噪、风格转换6项细分服务,这些技术将广泛应用于监控视频质量优化、美图应用等场景。
以下,从技术落地的角度,让我们从三个方面来看看实例,包括百度的定制化训练与服务平台EasyDL如何帮制造行业升级,百度OCR技术如何帮助医患平台改善用户体验,深度学习平台PaddlePaddle如何帮助构建智能楼宇。
定制化训练与服务平台——EasyDL
1、EasyDL能干什么?
今年4月,百度正式开放领先的定制化训练与服务平台——EasyDL,这是一款定制模型训练和服务平台,用户根据文字提示进行简单的页面操作,只需简单四步,最快10分钟即可训练业务定制的深度学习模型。这意味着,即使是完全不懂代码编程的技术小白,也可以零门槛快速上手。
目前,EasyDL已经开放图像分类、物体检测定制训练。在现场,百度AI技术生态部资深研发工程师李曙鹏演示了利用EasyDL建立辨别“圣女果和车厘子”的定制模型。
预计今年5月底,EasyDL将开放设备端本地计算能力,满足开发者在无网络或者网络环境受限下场景下、数据敏感性等条件下的需求。未来还会陆续开放如定制声音识别等能力,第三方数据采集及数据标注的数据服务以及私有化部署等。
2、EasyDL怎么用?
目前,已有多名开发者使用EasyDL,创建了多个模型,在零售、制造业、仓储物流、安防监控等多个领域实现广泛应用。比如,EasyDL可以用于监测超市购物车下层是否有未付款商品、判断零售门店陈列是否符合要求,还可以通过自动识别野生动物编号以更好监控动物的生存状态。
EasyDL部分应用案例
作为合作伙伴,CELLA展示了他们如何利用EasyDL实现木地板瑕疵检测。
CELLA创始人范维肖表示,他们致力提供端+云的AI解决方案,当前制造业在原材料准备环节存在问题,比如自动化水平低、人力成本提高、原材料分拣消耗量高而却准度不足。以木地板行业为例,长时间的工作时间和重复的操作方式,往往导致高人工成本而产能不足。
对此,CELLA利用EasyDL打造了一套制造业原料筛选工业级方案。在木地板瑕疵检测中,通过EasyDL训练获得木地板瑕疵检测模型,并发布生成离线SDK,再将SDK植入到CELLA自研的智能摄像头中组成地板瑕疵检测的软硬一体方案,使得前端具备检测地板各种瑕疵的能力。目前,已实现针对虫眼、结痂的训练模型。
通过这套方案,实际测试识别准确率达到95%以上,并在1秒内可完成瑕疵识别过程,仅检测这一环节便提高了将近%,每台机器3小时可以处理1万片,生产效率大大提高。而这一套方案可以在不用行业类似需求中使用,真正成为一套通用行业解决方案。
百度的OCR技术
1、百度发布自定义模板文字识别——iOCR
OCR技术是目前应用最为广泛的AI技术之一,据百度AI技术生态部高级产品经理袁运筹介绍,目前百度OCR(文字识别)技术在医疗、保险、银行、企业报销、快递物流、拍照识别/翻译、内容审核等多领域实现了落地应用。
但通用模板无法满足用户的特定文字识别需求。在实际应用中,用户还存在大量的结构化识别需求。针对于此,百度此次正式发布了百度自定义模板文字识别——iOCR,支持用户根据实际需求定制模板,生成的模板可重复利用,基本能够解决90%以上非结构化的文字电子化问题。
iOCR基于相对位置信息和NLP技术实现文档结构化,通过创建模板-选择参照字段-选择识别区-测试服务,简单4步、5分钟即可完成新模版的创建,实现结构化数据输出,具有多场景、快速高效、自动分类的优势。而自动分类功能将于6月4日上线,实现票据、卡证自动分类。
在现场宣布的免费升级*策是:百度通用OCR技术的免费额度从次每天提升至00次每天,是此前免费额度的倍;高精度通用OCR的免费额度从50次每天提升至次每天,是此前免费额度的10倍。
目前,业界通常按照每个接口的调用次数收费,单个接口单次调用费从几分钱到几毛钱不等,百度此次升级通用OCR及高精度通用OCR技术免费*策,实实在在为企业节约一笔不菲的支出。
2、如何利用iOCR改善医患平台用户体验?
云量互动CEO王娜娜分享了利用百度iOCR如何实现医患平台用户体验升级。
云量互动的AI实践
目前,云量互动共有零售货架管理、云量大数据、实时客流分析、OCR智能审核四大业务,致力用AI赋能行业。其中,利用OCR智能审核,云量互动在为一个