《蚂蚁呀嘿》火了,背后的AI技术不止换脸这么简单

《蚂蚁呀嘿》火了,背后的AI技术不止换脸这么简单,第1张

作者|小葳
2月底,各种版本的《蚂蚁呀嘿》在抖音刷屏。有网友说,“一打开抖音,好像捅了蚂蚁窝。”
通过一款名为Avatarify 的APP,用户只需上传一张照片,即可让照片主人做出各种想要的表情。截止发稿,《蚂蚁呀嘿》在抖音有超过25万个视频,相关话题视频播放量达到30亿次。Avatarify曾在2 月 25 日问鼎国内App Store 应用免费榜榜首,随后连续数天稳居总榜第一名。
相比ZAO火爆之后的3天后下架,Avatarify也逃不出换脸软件的宿命,只有7天便在APP Store中国市场下架(目前国外还可以使用)。
Avatarify 由一个俄罗斯程序员开发,并放在GitHub上,最初是给Zoom、Skype等视频会议“解闷”用的,比如可以在开视频会议时把自己的脸换成马斯克的脸,并实时互动。迄今为止这个项目已在 GitHub 上获得了近 12 万的 star 量。
几个月后,Avatarify又推出了APP版(只有iOS版)。原理上,Avatarify借助 deepfake 等技术,在想要交换的脸部图像上对算法进行训练。通过在目标图像的相似类别上训练算法,该模型支持实时换脸 *** 作。
类似换脸软件屡次被下架的背后还是隐私和信息安全问题。很多人都会担心自己的人脸信息被泄露或滥用,然而我们却不必对其背后的AI技术——深度合成一棒子打死。而且,目前深度合成在很多行业已经有了不少更有价值的应用。
深度合成首次被公众关注是2017年11月,彼时美国新闻网站Reddit一个名为“deepfakes”的用户上传了一段合成后的色情视频,将色情影片中演员的脸换成某明星的脸。此后,媒体开始用deepfake描述这种基于AI的视频合成内容。不过因此也让不少人误认为,深度合成就是deepfake、换脸,实在是太冤了。
首先,deepfake是深度合成的子集。只不过,换脸是最早进入公众视野,也是最为大众熟知的一种深度合成应用。
深度合成(Deep Synthesis)的内涵非常广泛,包括借助人工智能算法实现语音、图像、音频、视频、人脸等内容的合成与自动生成。其典型应用包括:人脸替换(换脸)、人脸再现( *** 纵目标对象的面部表情,比如让他们说从未说过的话)、人脸合成(AI生产媲美真实的人脸图像,事实上这张人脸并不存在)、语音合成、全身合成等等。
其次,deepfake频频导致的隐私安全和色情场景滥用问题,会让人们对深度合成技术存在偏见和误解,甚至认为AI伪造内容会冲击 社会 信任等等。不过,随着深度合成技术在更多领域的落地应用,公众对深度合成技术的认识也愈加成熟。
深度合成背后的AI技术主要包括两块:自编码器(autoencoders)和生成对抗网络(GAN, Generative Adversarial Networks )。GAN由两组相互对抗的人工神经网络组成,一个是生成器,一个是鉴别器,在无数次对抗中,生成器最终做到让鉴别器不再能够区分真实数据和合成数据,从而生成高度逼真的内容。
业界最先进的图像生成器当属英伟达的StyleGAN,已于2019年2月在Github上开源。
腾讯研究院、腾讯优图实验室发布的《AI生成内容发展报告2020——“深度合成”商业化元年》(以下简称报告)显示,近几年深度合成技术演进加快,并展现出几个技术趋势:
一、在单一的音频、图像合成之外,深度合成技术正向综合性的方向发展。

二、面部而成之后,全身合成将成为新热点。

三、2D合成之外,3D合成技术(尤其是虚拟数字人)将是下一阶段的重点。
而且,随着“深度合成”技术日趋成熟,其已经在多个领域实现落地应用,包括影视、 娱乐 、教育、医疗、电商、广告营销等领域。
在媒体行业,AI主播日益火热。2018年,搜狗联合新华社推出全球首个AI合成主播后,2020年,双方又推出全球首个3D AI合成主播。3D AI合成主播基于超写实3D数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,使机器可以基于输入文本生成逼真度极高的3D数字人视频内容,呈现和真人一样的视频播报。
此外,包括百度、京东、网易在内的互联网巨头先后推出虚拟数字人。百度智能云推出的虚拟数字人,成为国内首个上岗的银行“虚拟员工”。
在自动驾驶领域,深度合成被用于开发自动驾驶仿真系统(AADS),创造虚拟道路环境为自动驾驶系统提供训练和测试。
在医疗领域,通过生成与真实医学影像无异的医学图像训练AI系统,可以解决医疗数据不足、病患隐私保护等问题。在NVIDIA与合作伙伴联合发表的论文中,展示了利用GAN算法合成带有肿瘤的脑部核磁共振图像的方法。在算法训练生成过程中,仅需投入10%的真实数据,AI诊断系统就可以检测出真实影像中的肿瘤。
在广告营销领域,AI合成的人脸和虚拟形象可以替代真人模特参与营销活动,而不会有人像版权问题。比如,Generated Photos 就是一个用AI自动生成人脸的网站,它的资料库中有超过 10 万张AI生成的人脸,对外提供免费下载使用,而且没有版权问题。这些免费人脸可以用在非常多的场景,比如广告传单、网站、PPT 简报、问卷、用户头像等等。
深度合成被滥用是人工智能治理的一个重要课题。
色情行业是新技术采用和普及的先锋,AI技术也不例外。目前,色情产业是深度合成技术滥用的重灾区。根据报告,2019年12月,全网共有14678个深度合成视频,其中96%属于色情性的深度合成视频,主要存在于色情网站。
如何防止人们用深度合成技术作恶?多元治理是比较公认的思路,包括法律方案、技术方案、行业自律和公众教育等各个方面。
法律方面,一些发达国家已经出台相关法案。但值得注意的是,并没有“一刀切”禁止使用深度合成技术,而是禁止利用深度合成技术从事色情视频合成、虚假新闻、干扰选举等非法行为。比如美国国会《DeepFakes责任法案》等相关法案,只禁止政治干扰、色情报复、冒充身份等目的的深度合成,并要求制作者对深度合成内容添加水印等标记。
技术方面,鉴别技术和溯源技术是两种主流的方法。但是在鉴别方面,没有通用的视频鉴别方案,需要针对每一种新兴的合成技术训练针对性的鉴别网络。
虽然目前深度合成内容的门槛已大幅降低,普通人也可以在智能手机等智能终端能上完成 娱乐 性的深度合成内容,但这类内容往往较容易识别。高质量、高仿真的深度合成内容仍需要专业工具和技能。所以,我们需要防范风险但无需恐慌。
AI就像人类的一个非常聪明的学生,TA只是飞快又忠实地学会人类教的东西。
正如报告中所说,“深度合成并非是关于‘伪造’和‘欺骗’的技术,而是极富创造力和突破性的技术。虽然它和其他技术一样,也催生了一系列必须面对的难题,但这并不会磨灭这一技术给 社会 带来的进步。”

文/廖玉贞

“蚂蚁呀嘿,蚂蚁呀呼,蚂蚁呀哈哈……”这段时间,一款“蚂蚁呀嘿”的魔性特效,配上大家摇头晃脑的视频,在各大短视频平台刷屏了。这个玩法来自国外的一款AI软件Avatarify,该软件在短时间内就登顶苹果App Store免费榜,但不到一个星期就在App store中国区下架,业界猜测该款软件可能涉及隐私安全等问题。

“蚂蚁呀嘿”的制作过程很简单,只需上传一张照片到Avatarify,进入相应特效,AI技术就会将静态照片动态化处理,人的口型、眼神等神态与歌曲内容相匹配。在央视网报道的视频中,技术人员用利用深度合成中的表情 *** 纵的方法,将市面上共19款运用人脸识别技术解锁屏幕的手机逐一击破。也就是说,只要拿到一张人脸照片,利用该方法生成系统指定的张嘴、点头、摇头等指定动作,就可以冒充这个人完成人脸认证的环节。

下架并非排除AI技术隐患的最优解。在各大应用商店里,目前仍存在一批 “蚂蚁呀嘿”同款特效App,在电商平台上,各类同款换脸特效制作服务普遍且廉价,隐私泄露的风险从未消失,因而,仅下架一个App是不够的,还要警惕其他的各种换脸软件。作为软件与用户的连接者,应用平台对产品内容具有监督和管理的责任,在相关软件上架、推广时,要考量其对用户可能造成的侵害,加强审核和监管,明确权责问题,守住安全底线,绝不能把利益作为工作导向。

人脸识别技术是一把双刃剑,错的并不是技术本身。“刷脸购物”“刷脸坐地铁”“刷脸打卡”等,人脸识别技术,使人们的生活变得高效快捷,在各个领域也发挥着巨大的作用,比如帮助警方抓捕犯人、提高办公效率等。然而,一旦被泛滥应用,就会为公民个人信息泄露留下严重的安全隐患。在人脸识别过程中,人脸会以数字化信息进行储存,一旦保护力度不够,相关数据库就会面临着被攻击的危险,倘若有人故意借此收集人脸信息,人们往往也防不胜防。

在享受“数字化”时代便利的同时,更要善用技术,守住 娱乐 和安全的边界。人脸信息如何安全保管、合理使用,需要相关部门进一步完善数据管理、应用和流动等方面的法律制度,同时,人脸识别技术人员也应明确自身权责,从技术、制度等层面制定合理完善的保护机制,保障用户信息安全,守住法律底线。用户对于面部信息的使用也应当更加谨慎,主动辨别服务的规范程度,确保个人信息不被过度收集。

AI人工智能原创自动写作工具推荐:

第1个:搭画快写

搭画快写是国内专业的AI原创内容写作平台,它基于强大的40-60自然语言模型,从写作、批量写作、一键发布、批量发布、文字加粗、自动配图、AI智能封面设计、自动外链等全流程一键搞定。搭画快写可以让软文、论文、视频脚本、评论、小说、电商产品介绍、企业公司品牌介绍等一键生成。搭画快写目前也是国内AI人工智能企业营销服务领先的平台。

第2个:触站

触站是结合AI绘画、AI文章自动生成为一体的综合性AI人工智能内容生成平台,它通过使用AI技术来提供一站式内容创作服务,从AI绘画、AI原创文章、AI视频、AI设计到AI声音,全方位为个人和企业提供一站式内容解决方案。

第3个:文心一言

文心一言是一家专注于AI文章创作的企业文化服务商,旨在为企业提供高效率、高质量、高性价比的文案输出。作为一家AI企业级写作平台,它具备丰富的自然语言处理技术,在文章的选题、结构、语法等方面具有的完全的自主能力,可以无需人工介入就能自动生成符合企业需求的各种文本创作。

第4个:轻微课

轻微课是一款可以快速生成微课视频内容的AI平台,它基于深度学习算法,通过自动抽取并整理互联网上的视频、音频、图文等信息资源,基于业务数据模型生成符合企业需求的微课。平台用户可以根据具体的业务需求,快速生成和发布符合企业风格的微课视频。

阿里云AI依托阿里顶尖的算法技术,结合阿里云可靠和灵活的云计算基础设施和平台服务,帮助企业简化IT框架、实现商业价值、加速数智化转型。阿里云数十项AI能力,稳定、易用、能力突出,是AI技术应用、开发的不二之选。

活动: 点此进入阿里云AI人工智能试用中心
1、新客户完成首次注册,填写问卷即可参与第一次抽奖
首次注册即可参与本次抽奖,奖品包含罗技鼠标和天猫50元超市卡。
2、新客户完成首次购买,填写问卷即可参与第二次抽奖
您首次购买本活动页面的产品,且付款金额>0元即可参与本次抽奖,奖品包含罗技鼠标和天猫50元超市卡。

基于语音识别、语音合成等技术,为企业在多种实际应用场景下,赋予产品‘能听、会说、懂你’式的智能人机交互体验。
1、语音识别
国内独创的字级LC-BLSTM/DFSMN-CTC建模,大幅提高了语音识别的精度。
a一句话识别
针对时长较短(一分钟以内)的语音进行识别。
b一句话识别
对不限时长的音频流做实时识别,达到“边说边出文字”的效果。

2、语音合成
合成音真实饱满、抑扬顿挫、富有表现力,MOS评分达到业内顶级水准。
a录音文件识别
针对已经录制完成的录音文件,进行语音识别的服务。
b语言模型自学习工具
一键式自主优化方案,满足了各类用户对定制化场景的需求。

3、语音分析
构建语音交互场景下的口语理解和对话系统,提供给开发者自纠错能力及对话定制能力。

构建以图像视频为媒介的产品和应用,提升商业效率或创造商业新机会,广泛应用于新零售、新媒体、新制造等领域。
1、文字识别
将、照片上的文字内容识别出来,直接转换为可编辑文本的功能。
a通用卡证
包含 *** 正反面识别、护照识别、 *** 识别、名片识别、户口页识别。
b通用文档
高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。

2、图像识别
可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等。
a票据识别
可结构化输出行业所需的各类票据关键字段内容。
b手写识别
支持汉字、英文、数字、标点符号四类的手写体识别。

3、人脸识别
提供人脸检测定位、人脸属性识别和人脸比对等独立服务模块。

4、视频能力
通过对视频的多维理解,视频进行智能分析、主体识别、封面生成、内容检索等高效的服务。

致力于实现人与机器之间用自然语言进行有效沟通的各种理论和方法,在客服、资讯、司法、医疗等场景有广泛的应用。
1、自然语言处理
阿里云先进的自然语义处理技术广泛应用在电商、金融、物流等行业中。
a智能短信解析
在手机端实现智能化、富媒体的短信展现形式,增强用户体验。
b商品评价解析
高效甄别正负面评价,当前已支持24个行业类别。

2、语义理解
为客户提供文本相似度和机器阅读理解等优质算法技术。
a地址标准化
为企业,政府机关提供地址数据清洗,地址标准化能力。
bNLP基础服务
为各类企业及开发者提供的用于文本分析及挖掘的核心工具。

3、机器翻译
以解决全场景语言障碍为目标,覆盖全球214种语言。
aNLP自学习平台
无需算法背景,即可通过平台快速创建算法模型并使用。

4、内容安全
帮助用户降低色情、暴恐、涉政等违规风险,大幅度降低人工审核成本。

1、智能客服
随着人工智能技术不断发展,越来越多企业开始引入阿里云语音技术来搭建自己的智能客服系统。

2、信息审核
借助AI能力,有效改变了过去仅依靠人工内容审核的低效模式,极大提升内容审核的效率和准确度。

3、智能会议
随着云视频会议的快速崛起,结合语音、视觉等AI技术能力,为企业带来全新的会议体验。

4、智慧法庭
以信息化为核心的智慧法院建设,将引领司法领域的又一次技术革新,为行业带来更多价值。

5、智慧课堂
随着AI能力的引入,更好地赋能教学,有效提升教学效率,节省大量人力成本。

6、智慧医疗
帮助用户个性化定制导诊场景,避免患者盲目就医,有效提升就医体验。

7、搜索
结合不同行业应用和业务场景, 帮助用户在自建图库中实现相同或相似搜索的以图搜图服务。

8、智慧媒体
结合阿里云AI的能力,打造从内容采集、内容制作到内容展示一体化媒体解决方案。

1、金融AI
AI是普惠金融的核心驱动力之—,A可以赋能金融企业节省大量人力成本提高效率,从而改善用户体验和减少信息不对称,助力金融客户实现智能化升级。
传统行业痛点:
√金融行业往往需要投入大星的人力,不仅使成本居高不下之外,繁复核验猃更容易使客户不满、甚至失去客户;
√传统金融机构积累的大量纸质化信息的价值尚未被完全发掘,浪费大量数据资源;

阿里云AI带来的价值:
Al将成为银行沟通客户、发现客户金融需求的重要手段。人工智能技术在前端可以用于服务客户,借助自然语言理解、语音识别等技术打造的客服系统,广泛应用于各类金融机构,提供24小时不间断的问答和营销服务;依托计算机视觉技术主要集中在支付和金融账户登录等场景,从而助力金融客户实现智能化升级。

2、教育Al
随着AI技术的引入,教育行业正在脱离单教育辅助的角色,为受教育者提供科技赋能、内容完善、效果优良的课程,结合海量优质资源覆盖终身学习场景,实现高质量教育的可持续发展目标。
传统行业痛点:
√传统教育行业无法满足每一位终端用户的个性化学习;
√批改系统、教学课堂存在大量资源浪费,并且准确性存在偏差;

阿里云Al带来的价值:
以学习者为中心,借助阿里云AI能力,如语音、视觉、语义分析等AI技术,更好地赋能教学、管理、学习、考试四个重点场景,有效提升教学效率,节省大量人力成本。

3、交通Al
A智慧赋能交通行业,可助力交通信息广泛应用与服务,提升交通系统运行效率和管理水平,打造实时、准确、高效的城市交通智能体。
传统行业痛点:
√普遍存在的车辆干扰、遮挡标识等违法行为,对此需要大量人力成本去甄别辨识;
√城市交通高峰期缺乏有效预测,造成大面积拥堵;

阿里云AIl带来的价值:
通过借助AI的合理性、高效性,采集各种道路交通及服务信息,将深度学习、图像检测、机器视觉等技术应用在交通安全、文明出行、城市交通治理等场景中,可极大减少人工投入,大大提升工作效率,助力城市智能交通体系完善。

4、新零售AI
阿里云A技术渗透新零售领域,构建数据打通、场景贯通、深度触达的AlI+零售"体系,利用人工智能、算法等关键技术将人与货、人与场实时结合、真正打穿,全面提升运昔效率提升消费者体验,助力零售业数字化升级。
传统行业痛点:
√零售业是典型的劳动力密集型行业,在其运营、供应等环节需要大量的人力资源,通过AI辅助收银、客服、门店等场景提高效率;
√随着人口红利消失,如何降低线下获客成本成为每一个零售企业必须要面对的问题;

阿里云AI带来的价值:
阿里云AI航能新零售行业各环节,基于计算机视觉、语音语义及机器学习技术,赋翁能线上及线下零售商,在精准营销、商品识别分析、消费者识别分析、无人零售、智能客服等领域中广泛应用,有效降低人力成本,提升利润空间。

5、政务Al
以阿里云AI技术为基石,把人工智能技术属性和社会属性的高度融合,辅助政府在经济、治理、民生等领域的管理变得更加精细化、智慧化,整合并高效利用政务资源,助力政务数智化转型。
传统行业痛点:
√在有限的人力资源下,需要面对大量公众需求和提供完善便捷的办事服务;
√海量政务信息数据,人力处理成本高、精准度低;

阿里云Al带来的价值:
将人工智能技术广泛应用到政府工作中,利用文字识别、身份认证、人脸识别、智能客服等技术,加强政务信息整合和公共需求精准预测,有效提高工作效率,为政府服务工作的不断改善提供可靠保障。

6、司法Al
阿里云A正在利用大数据和人工智能推进着—场数字化、智能化革命升级,集中AI能力服务于中国司法行业,能有效提高司法效率、保证司法公开公正、提升司法公信力等作用和价值,为行业带来更多值得期待的创新。
传统行业痛点:
√存在大量繁琐的事务使法律服务效率低下,案件堆积成山;
√传统法律咨询服务价格昂贵,无法有效帮助大量个体获得法律咨询;

阿里云AI带来的价值:
随着阿里云AI技术的快速发展,在智慧法庭、智能庭南等领域下,需要依托智能大数据分析、语音识别、图像视预分析等多项人工智能技术,从而实现案情要素分析、庭审语音识别自动转写、庭审行为视频分析等功能,实现在减少人力投入、提高工作效率的同时,还能够比人工做得更快、更准确。

一个账号只能供一个人使用。
ai快销软件是一种应用于电商营销的软件工具,可帮助用户实现商品管理、线上销售、数据分析等多项功能。通常情况下,ai快销软件的使用需要登录账号并进行授权验证,以确保数据安全和使用权限。
根据大部分ai快销软件的规定,一个账号一般只能供一个人使用。这是基于软件许可证的限制和用户体验的考虑,以避免多人同时 *** 作导致数据混乱或冲突,并保障商家数据的安全性和完整性。


DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
乐在赚 » 《蚂蚁呀嘿》火了,背后的AI技术不止换脸这么简单

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情