精华书阁 > 身为法师的我只想追求真理 > 第三百七十章 M语言和最先被干掉的职业在线阅读

投推荐票 > 本页设置 > 手机阅读

第三百七十章 M语言和最先被干掉的职业

精华书阁 www.jhsssd.com,最快更新身为法师的我只想追求真理最新章节!

比如基于D5、基于用户的IP等信息设置黑名单库,直接基于规则进行拦截。

    大部分还是会采用算法模型,也就是用算法模型判断一张图像中是否包含sq信息,本质上就是图像识别。

    图像识别目前在部分任务上的效果甚至超越了人类。

    图像识别中最常见的就是图像分类算法,从Alex到VGG,从Res。

    目前的图像分类算法可以较为准确地区分Ia的1000类数据,鉴黄本身也是对输入图像做分类,因此采用图像分类算法就是顺其自然的事。

    而且目标检测算法可以用来检测sq图像中的露点部位,也是比较可靠的手段。

    此外,还有基于业务层面构造的特征和逻辑,比如是否有人、皮肤的面积等,用来辅助判断,在一些情况下确实是有效的。

    AI鉴黄的难点主要在于不露点的软sq,特征小的sq、非通用sq以及卡通动漫sq等等。

    这是图片ai鉴黄的难点,视频和音频鉴黄的难点就更多了。

    而且对于这帮互联网大厂来说,即便能够做到百分之九十九的拦截率,剩下百分之一的内容都不得了。

    以微博为例,每天产生的数据都是以T为单位。

    即便是几十个T,百分之一的拦截失误率,都足够把来总整的够呛。

    而且更重要的是华国的内容审核行业,不仅仅局限于鉴黄,OCR审查这帮互联网大厂更是很早就在做了。

    点到为止。

    同样的道理,百分之九十九的拦截率,对他们来说都是无法接接受的。

    所以一直到了2031年,依然是AI加人工的鉴黄方式。

    只是说2021年的时候像微博这个体量的,可能需要上千名鉴黄师,到了2031年只需要上百名。

    四位数变三位数。

    至于微信,你在一遍,然后丢到后端的审查接口。

    通过权重算法来判断你是否有违规行为,触发特定规则之后,会决定你倾向的权重,权重超过阈值之后你会被重点关注。

    将会有人工来对你进行审核。

    当然这种审核不仅仅是国内的大厂,fb、ins、***、Google和推特都有大量的人工审核团队。

    他们的审核团队放在菲律宾。

    在2018年的时候,关于这件事,PBS放过一个纪录片。

    对于国内外的互联网巨头们来说,他们在文字识别上能够做到接近百分之百,但是在图像分类测试中,只能做到98%左右。

    而且对算力有非常高的要求,压根用不到实际的生产环境里。

    这是Ia每年的图像分类测试竞赛结果,实际运营中的图像视频识别比Ia竞赛可要难得多。

    而郑理公开的AI算法后,利用语言写出来的模型。

    从部署到使用突破了这帮互联网公司的认知,一个能够对内容实现99.9的识别成功率的AI模型,需要花的算力和之前差不多。

    也就是说之前互联网大厂们几百人的AI鉴黄规模,现在再度被压缩了百分之九十。

    AI鉴黄只是语言最先落地的应用。

    它代表的AI技术,在算力优势以及算法本身的落地难度都大幅度提升。

    它允许轻松构建大部分原本复杂的架构,能够广泛的应用在工业领域。

    大量易于组合的模块化部件,编写自己的图层类型、计算图抽象、数据和模型并行、动态类型的稳定性等等都完美适配。

    在算法工程师们使用之后,Github上语言相关的(本章未完,请点击下一页继续阅读)
紧急通知:精华书阁启用新地址-www.jhsssd.com,请重新收藏书签!
为您提供大神乌鸦一号的《身为法师的我只想追求真理》最快更新,为了您下次还能查看到本书的最快更新,请务必保存好书签!

第三百七十章 M语言和最先被干掉的职业免费阅读.https://www.jhsssd.com

『章节有误?登录后点此报错~我们会尽快处理』
温馨提示:方向键左右(← →)前后翻页,上下(↑ ↓)上下滚用, 回车键:返回列表