橘子百科-橘子都知道橘子百科-橘子都知道

两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃

两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆以来,微软公司(sī)创始(shǐ)人比尔·盖茨已多次公开谈论人工智(zhì)能话题。在最近的一(yī)次采访(fǎng)中(zhōng),他(tā)再次表示:“AI可能会让科技行业迎来一次剧烈(liè)的洗(xǐ)牌”。

这(zhè)个(gè)结论(lùn)是他在当地时间2月20日接(jiē)受《In Good Company》节目(mù)专(zhuān)访时提出的。

他预(yù)期,AI的发展可能(néng)会(huì)威(wēi)胁(xié)到谷歌的市占(zhàn)率,因为微软在AI方面的行动相当(dāng)迅速。而最终科技巨头将把AI整合成用户的“全(quán)能助手”,包揽(lǎn)一切应用(yòng),与人们(men)进行沟(gōu)通并(bìng)提(tí)供建议(yì),可以取(qǔ)代(dài)亚马逊、Siri或Outlook等应用。

大(dà)佬(lǎo)口中全能助手的到来可能尚需时日,但(dàn)由(yóu)ControlNet引发的(de)又一次AI绘画浪潮,让AIGC在ChatGPT的话题热点(diǎn)包围(wéi)中杀出重围。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控(kòng)靠近(jìn)

以AI绘(huì)画为代表的AIGC上一次爆火(huǒ)的时候,还(hái)是2022年(nián)8月(yuè),在美国科(kē)罗(luó)拉多州举办(bàn)的新(xīn)兴数字艺术家竞(jìng)赛中(zhōng),一幅名为(wèi)《太空歌剧(jù)院(yuàn)》的作品获奖(jiǎng)。

随后各大厂(chǎng)商的AI绘画软件被广大(dà)网友(yǒu)熟知并体验,Stable Diffusion便是其中(zhōng)代表。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将(jiāng)洗牌(pái)科(kē)技行业?_黑料正能量

用(yòng)户(hù)们可以在应用中输(shū)入一组关键(jiàn)词或者(zhě)一张照片,就能获得一幅AI创(chuàng)作的(de)画作。

作画的关键就是所输入的文(wén)本。同一组关键(jiàn)词也可以创作出很多张(zhāng)风格不一样的画作,这让创(chuàng)作的过程就像开盲盒。

很多用户(hù)很喜(xǐ)欢这种不确定的惊喜(xǐ),他们会(huì)将生(shēng)成的美图当做(zuò)头像。而另一(yī)部分喜欢翻看AI绘画的“翻车”作(zuò)品。在(zài)社交媒体上,许多(duō)用户(hù)分享AI“翻车(chē)现(xiàn)场”,例如,一位网友的小狗照(zhào)片(piàn)被AI画成了“肌肉男”,还有网友(yǒu)的个人照片被AI识别成(chéng)了建筑(zhù)。

而(ér)如今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可(kě)能要被颠覆(fù)了。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能(néng)量

ControlNet是一(yī)位正在斯坦福(fú)读博的中国(guó)人张吕敏创作的(de)一种基(jī)于控制点的图像变形算法,主要用于数(shù)字图像处理、计算机视觉和计算机图形学等领域。

其SD插(chā)件一经发(fā)布,在短短(duǎn)的两天内便成为了AI绘(huì)画(huà)领域最新的热点。

在此(cǐ)之前,大(dà)家用了很多方法想让AI生成(chéng)的结果尽可(kě)能的符合要求(qiú),但是都不尽如(rú)人意(yì),它(tā)的出现代表着AI生成开始进入真正的可控时期。

因为ControlNet可以直接提取画面(miàn)的构(gòu)图,人物的姿势和画面的深度信息等。有了它(tā)的帮助(zhù),就不(bù)用(yòng)频繁(fán)的用提示词(cí)来碰(pèng)运气(qì),抽盲盒(hé)式的创作了。

通俗的说ControlNet相(xiāng)当于给AI绘(huì)画加了“魔法(fǎ)”,不(bù)少博主(zhǔ)的(de)作品已经(jīng)获(huò)得了大量的浏览量,“viggo”就是其(qí)中(zhōng)之一,他(tā)用朋友(yǒu)的照片直接(jiē)带她们走进动漫世(shì)界。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量(liàng)

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应(yīng)的关(guān)键词(cí);最后用ControlNet插(chā)件绑定骨骼开(kāi)始(shǐ)换关键词试效果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌(pái)科技(jì)行(xíng)业?_黑料正能量

通过(guò)图(tú)片就可以看出来(lái),效(xiào)果(guǒ)十分惊艳(yàn)。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑料正能量

ChatGPT之(zhī)后又一应用(yòng)杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌科技(jì)行业?_黑料正能(néng)量

更厉害的(de)是,除了真实的照片,草(cǎo)图也可以加上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介(jiè)绍到(dào)ControlNet还能(néng)实现(xiàn)线稿(gǎo)转全彩图。大神(shén)张吕敏(mǐn)其(qí)本尊(zūn)也亲(qīn)自(zì)回应。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

不得不说当下AIGC已经(jīng)变得(dé)越来越强大,甚至输出(chū)的作(zuò)品都已经能以假(jiǎ)乱真(zhēn)了。

02

难辨(biàn)虚(xū)实,AIGC技(jì)术(shù)力爆(bào)发

警(jǐng)惕(tì)安(ān)全问题

近(jìn)日(rì),“苏州金鸡(jī)湖(hú)有游艇party”的(de)消息火遍网络,而经过警(jǐng)方(fāng)辟谣这(zhè)所谓的“party”可能(néng)是全国(guó)第一(yī)起(qǐ)AI绘(huì)图诈(zhà)骗(piàn)。

由于这个活动(dòng)里(lǐ)面给出的美女照片都是AI制作的(de)真人照(zhào)片(piàn)绘图,因(yīn)为太(tài)逼真,被大家当成(chéng)真(zhēn)事(shì)传播了

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑料正能量

不过(guò)仔(zǎi)细观察可以(yǐ)发现,活(huó)动发起者提供的照片中有(yǒu)个很大的漏洞可以发(fā)现(xiàn)并非真人,而是AI绘图,那便是图片中女性(xìng)的手指(zhǐ)部(bù)分有(yǒu)的存在异常。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能(néng)量

有行业人事表(biǎo)示:“现在因为手指部分的绘画算法比较复杂,AI还不太会(huì)画(huà)人(rén)的手,但最新看到的图片(piàn)已经有越来越(yuè)完美的(de)AI模型(xíng)出现,以后可能就完全(quán)没有漏洞了。

类(lèi)似的(de)AI作图(tú)诈(zhà)骗在国(guó)外也已(yǐ)有发生。据英国广播公司报道,土耳其地震期间,有Tiktok用户使用AI合成了儿童受(shòu)灾的假照片(piàn)发布(bù)到网络,以此诱骗善良的人打赏“捐助”从而(ér)实(shí)施诈骗。

目前随着技术(shù)发展,AIGC已经能做出真人(rén)照片般的(de)绘图效(xiào)果,如果(guǒ)这样的(de)图片被(bèi)用(yòng)来诈骗(piàn),将(jiāng)非常可怕(pà)。

此外(wài)AIGC还(hái)引发了(le)很多担忧,一方(fāng)面,批(pī)判者(zhě)认为AI在“学习”了大量前人的作品之后,其创作(zuò)没(méi)有任何情绪和灵魂,难以和人(rén)类的(de)艺术(shù)创作相提(tí)并(bìng)论(lùn)。

另一方面,AIGC背后的版权(quán)、目前都并没有得到有效(xiào)的解决(jué),还有AIGC会不会代替人类“至(zhì)高无上(shàng)”的创(chuàng)意。

马斯(sī)克(kè)也强调,人工智能的安全问题需要得到重视(shì),太晚就来(lái)不及了。

03

AIGC下一站除了视频,还有远(yuǎn)方

技术(shù)都是有两面性(xìng)的,潜在(zài)的危害(hài)并不能(néng)掩(yǎn)盖其光(guāng)辉的贡献。现(xiàn)在(zài)看来,人工智(zhì)能技术将是第四次工业革命的(de)核心驱动力量,将创造新的增长奇迹(jì)。

过去一两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃年,人工智能在(zài)技术和(hé)商业(yè)层面(miàn)都有了(le)巨大进展,AI绘画就是人工智能技术发生(shēng)方向(xiàng)性改变的一个代(dài)表。其下一站(zhàn)或许(xǔ)就是(shì)视频。

此前(qián),Meta和谷歌先后发布了几条引(yǐn)爆(bào)科技圈的短视频。这(zhè)些视频(pín)引发(fā)关注并非内容做得多(duō)优秀(xiù),反而都非常(cháng)简(jiǎn)单,比如一匹正在喝水(shuǐ)的马,一只(zhǐ)画(huà)画的玩具熊,或者一段骑摩托车的第一视角(jiǎo)录像,随(suí)便(biàn)一个有(yǒu)手机的人都可以(yǐ)随手录下一段。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

但(dàn)这些短视频(pín)的创(chuàng)作方式非(fēi)常简单(dān),创作者仅仅需(xū)要向AI输入一段话(huà),甚至只是说一下要求(qiú),AI就可以根据(jù)需要生成一段视(shì)频(pín)。

谷(gǔ)歌发布(bù)的两(liǎng)个(gè)AI生成视频分(fēn)别来(lái)自于Imagen Video和Phenaki,前(qián)者(zhě)主要突(tū)出的是高清(qīng),与Meta的Make-A-Video没(méi)有太多的差别(bié)。

在Make-A-Video公布(bù)了AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出更高(gāo)清视(shì)频的AI还不足以在短时间(jiān)内戳中兴(xīng)奋点。

Phenaki更加令人(rén)震惊(jīng)的地(dì)方在于(yú),它(tā)可(kě)以制(zhì)作出超过2分钟的连贯(guàn)的也有确切(qiè)内容(róng)的视频,这才是真正(zhèng)让人(rén)们感到(dào)惊喜的地方。因为无(wú)论AI生成的视(shì)频(pín)多么(me)高(gāo)清(qīng),也只能是为内容生产者(zhě)提供一个灵感(gǎn),一个素材,一个过场动画(huà)。

不过能够制(zhì)作出(chū)有具体剧情内容的视频(pín)就意味着(zhe),一些(xiē)视频创作由AI代替人工完成已经初(chū)步有了(le)可能(néng)。

当下AI的发展速度已经超(chāo)过(guò)大部分人的想象。内容产(chǎn)业(yè)的本质是(shì)供给创造(zào)需(xū)求,AIGC作为全新的(de)内容生(shēng)产方式(shì),可(kě)以为内(nèi)容产(chǎn)业(yè)带(dài)来(lái)更新的内容(róng)风格、更快的生产速度,更低(dī)的(de)生产成本,这无疑会(huì)驱动内(nèi)容产业的(de)大爆发。

除了(le)AI绘图、视频,AIGC技术还能应(yīng)用(yòng)于(yú)音乐、代码、机(jī)器(qì)人动作等多种内容形式(shì)的(de)生成(chéng)。不难发现该项技术不仅在(zài)游(yóu)戏等行业能得到有效应用,对(duì)于下一代(dài)互联网各(gè)种元素(sù)的构(gòu)建(jiàn)亦有关键意义。

从商业化的(de)角度来看,文化(huà)娱乐、教(jiào)育、传媒(méi)等(děng)诸多领域(yù),本身(shēn)就对基于AI的可视(shì)化内容有强烈需求(qiú)。

因此,AI绘画及视频或不是结果,而只是(shì)AI进程中的一块重要拼图,有望在(zài)技(jì)术更新的加持下实现更大的应用价值(zhí)。

AI从(cóng)理解(jiě)内容,走(zǒu)向了可以生(shēng)成内容,甚至能(néng)够创造出(chū)独立价(jià)值(zhí)和独立(lì)视(shì)角的内容(róng)。AIGC的再(zài)次(cì)出圈,更代(dài)表着未(wèi)来(lái)的(de)先进(jìn)生产(chǎn)力即(jí)将(jiāng)到来。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行(xíng)业?_黑(hēi)料正能(néng)量

04

紧抓(zhuā)大(dà)模型与算(suàn)力,牢(láo)固(gù)AIGC底座

从技(jì)术的发展也可以(yǐ)看出,在语言(yán)大模(mó)型、图像大模(mó)型之后,多模态大模型(xíng)已(yǐ)经成为了新的趋势。

大模型(xíng)被誉为(wèi)当前人(rén)工(gōng)智能发展的(de)智能底座(zuò),是全球竞争最(zuì)激烈(liè)的研究方向之一,包括谷歌(gē)、亚马(mǎ)逊(xùn)、百度、阿(ā)里、腾讯(xùn)等众多头部(bù)企(qǐ)业都在竞(jìng)相发力。

不过训练大(dà)模型(xíng)的确价格不(bù)菲,以国盛证券发布(bù)的《ChatGPT需要多少算(suàn)力(lì)》报告估算,GPT-3训(xùn)练一次的成本约(yuē)为140万美元。而对于一些更(gèng)大的LLM(大型(xíng)语言模型),训练成本则(zé)介于200万美(měi)元至1200万(wàn)美元高价之间。

以ChatGPT在2023年1月的独(dú)立访客平(píng)均数(shù)1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初(chū)始投入成本约(yuē)为(wèi)8亿(yì)美元,每日仅电费就在5万美元左右。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力(lì)支持。在关(guān)注(zhù)各(gè)类大模型(xíng)的发展同(tóng)时,更应该(gāi)关注算力网络的建设。

算力网络正(zhèng)驱动AI产业发(fā)展进入史诗级加速进程,让AIGC及通(tōng)用AI这一人工智能发展的(de)终极目标离得更近。

因为算力可以对(duì)突破(pò)性技(jì)术创新提供大力的支持。这方(fāng)面,多模态(tài)大模型是典型。作为面(miàn)向(xiàng)未(wèi)来强人(rén)工(gōng)智能、通用人工智能的重要(yào)技术(shù)创新,多模态(tài)大模(mó)型(xíng)已经在(zài)人工(gōng)智能领域提出(chū)了很(hěn)多年,业界也有(yǒu)不少(shǎo)技(jì)术突破,但是,多模(mó)态大模(mó)型进一步往下走(zǒu),算(suàn)力需求呈几何式上升,一般的算力基础(chǔ)设(shè)施很快将难以胜任。

从图像、文(wén)字、语音单(dān)独一项(xiàng)的训练,到双模态、三模态的跃迁,让人工智能可以灵活应对不同模(mó)态的转化、像(xiàng)人与世(shì)界交互(hù)一样自(zì)然,这方面,由算力网络来(lái)驱动将有明显优势。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

此外,还(hái)有很多需要爆发式(shì)增长的算力来支撑(chēng)的技术创新,将(jiāng)在人工(gōng)智能(néng)算力(lì)网络支撑(chēng)下快(kuài)速推进。

AIGC已经(jīng)露出曙光(guāng),期待(dài)在大模型和大(dà)算力的支持下AIGC能持续(xù)颠覆内容生产的方式,将创造的边(biān)际成本降低(dī),让万众受益。

未经允许不得转载:橘子百科-橘子都知道 两只小白兔在衬衫里抖来抖去,老师两只大兔子来回晃

评论

5+2=