春暖花开时,疫情终会过去。百度大脑2月推出AI战疫—口罩识别、肺炎影像识别等一系列专项抗疫能力,3月加码升级40余项AI能力,在教育、生活领域发挥更大的应用价值。
百度AI多人体温检测守住校园防疫“第一道防线”;语音技术助力信息无障碍,让无声世界的教学体验更流畅;泛阅读类APP接入百度语音能力满足大众“听书”诉求。更多最新AI能力及应用,本文帮你一览全局!文末有彩蛋,AI能力史无前例限时优惠!
AI+教育:智慧安全校园管理复学,特殊群体同样“停课不停学”
百度AI测温、口罩检测、人流量统计为复学防疫提供多项校园安全解决方案——多地明确开学时间,逐渐恢复正常的教学秩序。在师生跨入校园的第一步,校门就是他们的安全防线。如何快速进行测温,保障安全,是亟待解决的重要问题。
百度以AI图像识别技术和红外热成像技术为核心的“百度AI多人体温检测解决方案”已在多地部署并完成超过数百万人次的快速测温检验。
此前,百度大脑AI人脸识别技术已在校园得以应用,如广州市白云区华龙小学曾部署了十牛信息科技公司基于百度大脑AI人脸技术开发的“智慧校园AI人脸一站式解决方案”。
该方案可使用百度大脑人脸识别技术进行特征识别以核验学生身份,实时统计、无感刷脸考勤,在提高学校考勤工作效率的同时,有效保障校园安全。疫情特殊时期迎来复工复学,戴口罩人脸识别结合AI测温的整合解决方案将为学校提供实时、高效的安全防护。
借力百度大脑语音技术推出慧译视频字幕系统,让无声世界的教学体验更流畅——面对新冠肺炎疫情导致的延期开学,一场基于“全民直播”的教学行动正在各地上演。
当大多数学生都能通过直播听课与老师互动交流、答疑解惑时,有一群听力有障碍的孩子们面对直播却十分苦恼,他们听不清老师所讲、没有字幕可看、更无法与老师互动接受指导。
为保障疫情期间的如常学习,专门为听障人士做产品研发与服务的洛阳乐往网络科技有限公司(后文简称“乐往科技”)借助百度大脑语音技术推出慧译视频字幕系统,让被按下“静音键”的听障学生也能跟上“停课不停学”的进度。乐往科技立刻为慧译APP接入百度语音技术,集成百度大脑远场语音识别、实时语音识别能力,很好地实现在手机上通过APP,持续将3-5米之外说话人的声音转化为文字,并具有极高的准确率、极快的识别速度,让听障群体可以和普通人得以进行无障碍沟通。慧译APP极大地满足了全国多万听障群体的沟通交流需求,而面对此次疫情下的需求乐往科技同样反应迅速。
AI+生活:信息无障碍,“听书”阅读新体验
百度大脑为公益项目开放权益,让每个人享受“信息无障碍”——携手机构/企业/个人一起在“信息无障碍”领域为残障、聋哑、留守儿童、空巢老人等打造软硬一体的AI服务。
目前,开发相关的公益项目所使用的AI技术能力调用量每天超过1亿次,典型如“AI导盲眼镜”、“信息无障碍沟通慧译APP”、“图片智能读屏”等应用,缩小数字鸿沟,实现所有人平等地使用现代科技,更好的学习、工作、生活。为了进一步加大信息无障碍工作力度,百度大脑开放平台已于19年11月正式推出AI公益计划——因AI而声。针对具有公益属性的产品和项目,提供更多的资源和技术倾斜。
沉浸书海不间断,语音合成技术日均调用量增加20亿——春节以来,在线阅读迎来“高光时刻”。有声阅读这种适用于多场景和碎片化时间的阅读方式,正在逐渐影响着人们阅读的习惯。
无论是校园教育,还是走入职场后的自我学习,阅读始终都是人们提升能力的重要途径,而借助音频形式,更有助于让优秀文学作品触及更多年轻读者群体。从读书到听书,百度大脑的语音技术既帮阅读软件开拓了全新的阅读场景,也惠及着背后数以亿计的读者,让一键“听万卷”成为现实。
AI+快消:重磅推出快消数字化访销解决方案,全面助力快消品牌商对访销过程进行精细化管理
快消品牌商的终端网点遍布全国,为了确保终端执行的透明度和可控性,开始使用SFA、DMS等管理工具进行数字化访销转型,并探索利用AI技术对现有的数字化访销实现“降本、增效、动销”。
百度大脑近期推出的数字化访销解决方案是围绕快速消费品企业在线下渠道中的销量逻辑,提供基于拜访、分销、动销等环节的一站式AI服务,通过对访销过程的精细化管理,提升一线业务人员人效,最终实现销量的增长;其中包含智能路径规划、门脸识别、翻拍识别、EasyDL零售版-商品检测、货架拼接、价签识别、票据证件识别等10+专项AI能力,并与多家知名服务商及品牌商深入合作,实现了在访销各业务场景中的落地使用,有效提升终端门店管理与执行的效率和效果,让数据分析更高效精准,有效缩短决策时长,从而实现市场运营与决策的智能化。
40余项AI能力上新升级,最高免费赠送次调用量
1.人脸与人体识别:5项能力升级优化,1项新能力开放邀测
人脸私有化部署包升级
支持部署到「本地服务器」的人脸识别模型服务,提供人脸检测、人脸比对、人脸搜索、活体检测等基础功能,支持百万级超大型人脸库,可实现毫秒级响应。支持戴口罩的人脸检测和人脸识别能力,现已优化口罩检测和识别功能,在正脸角度下口罩识别准确率可达到95%。
人脸检测与属性API升级
上线口罩检测功能,通过调用人脸检测接口,实现对用户是否佩戴口罩属性的检测,同时配合人脸对比/人脸搜索接口识别戴口罩人身份,可广泛应用于人脸考勤,会员识别等场景。
人体检测与属性识别API及私有化服务升级
新增face_mask字段,增加口罩检测功能,正面、侧面角度抓拍均支持。疫情期间公共场所口罩佩戴情况检查、各类工厂安全生产规范着装检测均适用。
人体关键点识别模型升级
优化模型效果,提升21个关键点定位的精度,包含头顶、五官、颈部、四肢主要关节部位,支持多人检测、大动作等复杂场景。
人像分割服务升级
增加人体检测功能,以便过滤“无人”时仍强行分割的badcase,同时优化分割效果(减少白边、误分割等)。
指尖检测开放邀测
检测图片中的手部并返回坐标信息,精准定位食指指尖、及4个辅助关键点的坐标位置。模型针对儿童学习机点读场景进行专项调优,可用于点读搜题、自动跟读等应用。
2.语音识别:1项能力全面商用,1项能力开放公测
离线语音合成SDK全面商用
离线语音合成SDK在原有按设备数售卖模式的基础上,新增按产品线授权售卖模式,适用于APP类产品,单台价格低至0.5元。离线语音合成能力帮助产品在无网弱网环境下也能流畅合成,适用于阅读听书、资讯朗读、订单播报等场景。多种音色风格充分满足个性化需求,支持中英混读,更有粤语、美式英语专用音库。
音频文件转写开放公测
支持批量上传音频文件识别为文字,12小时内返回识别结果。多采样率多场景声学建模,支持普通话和略带口音的中文识别、支持英文识别。适合录音质检、会议内容总结、音频内容分析等场景。
3.OCR:1项能力正式商用,2项能力开放公测,2项能力升级优化
行程单识别正式商用
支持对飞机行程单的12个关键字段进行结构化识别,包括印刷序号、姓名、始发站、目的站、航班号、日期、票价、民航发展基金、燃油附加费、其他税费、合计金额、填开日期。一次性享有次免费调用量,超出免费调用量可开通付费功能。行程单识别已于3月27日全面升级并上线计费功能,识别准确率大幅提升,付费方式灵活多样。
机动车销售发票开放公测
支持对机动车销售发票的26个关键字段进行结构化识别,包括发票代码、号码、开票日期、机器编号、购买方信息、车辆信息、销货单位信息、价税合计、价税合计小写、税率、税额、不含税价格等。公测阶段一次性享有次免费调用量。
公式识别开放公测
支持对试卷中的数学公式及题目内容进行识别,可提取公式部分进行单独识别,也可对题目和公式进行混合识别,并返回Latex格式公式内容及位置信息,便于进行后续处理。公测阶段未实名用户一次性赠送次;完成个人实名认证,提升至5,次;完成企业实名认证提升至10,次。
护照识别升级
生日、姓名、姓名拼音、出生地点、护照号码识别准确率均提升40%以上,识别准确率达到90%以上;失效日期字段提升35.51%,达到86.55%;签发地点提升24.71%,达到91.38%;性别提升6.25%,达到%。
iOCR自定义模板文字识别平台升级
iOCR通用版/财会版新增“预置模板”功能,预置对应场景常用的卡证/票据模板,无需制作即可直接调用完成结构化识别;新增关键词辅助分类功能,可填写模板中独有的文字内容,作为模板分类的文字依据,并可结合文字信息与图片特征进行分类器训练,提升模板分类准确率。
4.图像技术:1项能力正式商用,1项能力升级优化,3项能力开放邀测
人像动漫化升级并正式商用
运用对抗生成网络技术,结合人脸检测、头发分割、人像分割等技术,为用户量身定制千人千面的二次元动漫形象。近期人像动漫化再次升级,能够支持多人效果及戴口罩二次元形象,并正式支持商用。
图像风格转换新增7种转换风格
可将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用。近期图像风格转换升级,新增7种转换风格:彩色铅笔画风格、哥特油画风格、彩色糖块油画风格、呐喊油画风格、神奈川冲浪里油画、奇异油画风格、薰衣草油画风格。
天空分割开放邀测
天空分割可智能分割出天空边界位置,输出天空和其余背景的二值图和灰度图,可用于二次处理进行天空替换等图片编辑场景,目前已开放邀测。
图像多主体检测能力开放邀测
在原有“单主体检测”服务的基础上,全新推出“多主体检测”服务,支持对图片中的多个主体进行识别框选,输出主体的坐标位置、标签名称及标签置信度得分,支持对框选出的主体进行裁剪,方便进行二次开发,适用于图像处理、提升图像识别精度、海量图片分类打标、辅助智能识图等场景。
绘本图像搜索开放邀测
全新推出了绘本图像搜索能力,针对拍照搜童书场景专项优化算法,支持用局部绘本页面图片,精准检索自建库中对应儿童书本教材,现已开放邀测。
5.自然语言处理NLP:2项能力开放邀测
智能招聘解决方案开放邀测
企业招聘解决方案包含简历解析、人岗匹配、人才评估、招聘机器人等多项应用能力,帮助企业节省招聘成本,缩短招聘周期,将HR从日常海量简历和琐碎沟通中解放出来。目前和可通过