宠物网_宠物猫_宠物狗_16宠物网

首页>狗狗养护 / 正文

今日头条升级灵犬反低俗助手新增图片识别功能

147小编 2022-09-23 09:40:31 狗狗养护 5 ℃

7月30日,今日头条宣布正式推出新版灵犬反低俗助手(以下简称灵犬),同时支持图片和文本识别。这是时隔半年后,灵犬的又一次重要升级。

据介绍,灵犬脱胎于今日头条反低俗模型,是一款检测内容健康度的辅助小工具,致力于打击低俗低质内容,净化网络空间。用户目前可以在今日头条内,搜索灵犬进行试用。

当天下午,一场名为算法如何反低俗的沟通会在字节跳动总部举办。字节跳动人工智能实验室总监王长虎现场介绍了灵犬背后的技术原理。

新版灵犬重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别(反色情低俗、反血腥暴力)和文本识别(反色情低俗、反暴力谩骂、反标题党)。后续还将支持语音识别和视频识别。

此前一年时间内,灵犬已陆续完成两次迭代。2018年3月28日,今日头条首次上线灵犬,支持检测文字和文章链接。2018年5月16日,灵犬完成服务能力升级,增加反色情短文本模型和反谩骂模型,将准确率从73%提升至82%。2019年2月20日,灵犬2.0正式上线,除了反色情低俗模型,加入反暴力谩骂和反标题党模型,覆盖了主要的低俗低质内容类型,整体识别准确率接近85%。截至2019年6月,灵犬反低俗助手的使用人次已经超过了300万。

用户只需要在灵犬内输入一段文字或文章链接,灵犬就可以帮助其检测内容健康指数,返回一个鉴定结果。对于用户输入的内容,灵犬会先进行提取、分词和语义识别,然后根据相关规则, 输出对应的分数、评级和结论。这仅需短短几秒便完成。图片和图片链接检测同理,用户在灵犬内上传图片或图片链接,即可快速获取鉴定结果。

据王长虎介绍,灵犬背后的文本分类模型,已经经过了三次迭代。每个新版本相对于旧版本,在技术和数据集层面,都有一个明显的跃升。

这一代灵犬训练数据集总量是1.2个T,相当于20倍百度百科或100倍维基百科的数据总量,包含920万个样本,准确率提升至91%。

不同于文本识别,图片识别的技术难点主要在于三方面:非均衡、类内方差大和不可穷举。即,低俗图片占整体图片内容的比例较低,低俗图片的种类丰富、繁杂,构成低俗图片的特征千差万别。

对此,灵犬运用的解决方案,是深度学习。王长虎表示,针对低俗判断问题的复杂性和不同判断方式的局限性,一方面需要不断进化技术模型,一方面需要有效结合技术和人工判断两种方式。

当前,灵犬建设了比较完善的模型迭代系统。通过数据收集—数据标注—数据清洗—模型训练—模型评估—badcase分析这一套完整的流程,持续做优化。

上游新闻·重庆商报记者 侯佳 实习生 李蕾

【免责声明】上游新闻客户端未标有来源:上游新闻-重庆晨报或上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。

Tags:

搜索
网站分类
标签列表