橘子百科-橘子都知道橘子百科-橘子都知道

现实中真的可以把人玩坏吗

现实中真的可以把人玩坏吗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊(liáo)天机器人ChatGPT火(huǒ)爆以来,微(wēi)软公(gōng)司创(chuàng)始人比尔·盖茨(cí)已多次公开谈论人工(gōng)智(zhì)能话题。在最(zuì)近的一次(cì)采访中,他(tā)再次(cì)表示:“AI可(kě)能会让科技行(xíng)业迎来一(yī)次剧烈(liè)的(de)洗(xǐ)牌”。

这个结论是他在(zài)当地时(shí)间2月20日接(jiē)受《In Good Company》节目专访时提(tí)出的。

他预期,AI的发展可能会威胁(xié)到谷歌的市占率,因(yīn)为(wèi)微(wēi)软(ruǎn)在(zài)AI方面(miàn)的行(xíng)动相(xiāng)当迅速。而最终科(kē)技巨(jù)头将(jiāng)把AI整合成(chéng)用户的(de)“全能助手”,包揽一(yī)切应用,与人们(men)进行(xíng)沟通并(bìng)提供建议,可以取代亚(yà)马逊、Siri或Outlook等(děng)应用。

大佬(lǎo)口(kǒu)中(zhōng)全能助(zhù)手的到来可能尚需时日,但由ControlNet引发的(de)又(yòu)一(yī)次AI绘画浪潮,让AIGC在ChatGPT的话题(tí)热点包围中(zhōng)杀出重围。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技(jì)行业?_黑料正能量

01

ControlNet颠覆AI绘画新(xīn)玩法(fǎ)

AIGC向(xiàng)可控(kòng)靠近

以AI绘(huì)画为代(dài)表的AIGC上一次爆火的时候,还是2022年8月,在美国科罗拉多(duō)州举办(bàn)的新兴数字艺术(shù)家竞赛中,一(yī)幅名为(wèi)《太空歌剧院》的作(zuò)品获奖。

随后各大厂商的AI绘(huì)画软件被广大网(wǎng)友熟知(zhī)并体验,Stable Diffusion便是其(qí)中代表。

ChatGPT之后又一应用(yòng)杀(shā)疯了(le),AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量

用户(hù)们可以在(zài)应用中输入一组关键词或者一张照片,就能获得一幅AI创(chuàng)作(zuò)的画作。

作(zuò)画的(de)关(guān)键就是所输(shū)入的文本。同(tóng)一组关键词也可以创作出很多张风(fēng)格不一样的画作,这让(ràng)创作的过程(chéng)就像开(kāi)盲盒。

很多用(yòng)户(hù)很喜欢这种不(bù)确(què)定的惊喜,他们会将生成的美图当做头(tóu)像(xiàng)。而另一部分喜欢翻看(kàn)AI绘画的(de)“翻车”作品。在社交(jiāo)媒体上,许多用(yòng)户分(fēn)享AI“翻车现场(chǎng)”,例如(rú),一位网友的小狗照片被AI画(huà)成了(le)“肌肉男”,还有(yǒu)网友的(de)个人照片被(bèi)AI识别成了建筑。

而如今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可能要被(bèi)颠覆(fù)了(le)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是一位正在斯坦福读(dú)博(bó)的中国(guó)人张吕(lǚ)敏创作的一种基于控制点的图像变形算法,主要(yào)用(yòng)于(yú)数字图像处(chù)理、计算(suàn)机视觉和计算(suàn)机图形学等领域(yù)。

其SD插(chā)件一经发布,在(zài)短(duǎn)短的两天内便成为了AI绘画领域最新的热点。

在此之前,大家用了(le)很多方法(fǎ)想让AI生成的结果尽(jǐn)可能的符合要求,但是(shì)都不尽(jǐn)如人(rén)意,它的出(chū)现代表(biǎo)着AI生成开始(shǐ)进入真正的(de)可控时期(qī)。

因为ControlNet可以直接提取(qǔ)画面的构图,人物(wù)的姿势和画(huà)面的深度信息等。有(yǒu)了(le)它的帮助(zhù),就不用(yòng)频繁的用提示词来碰运气,抽(chōu)盲盒式的(de)创作了。

通俗(sú)的说ControlNet相当(dāng)于给AI绘(huì)画(huà)加了(le)“魔法”,不少(shǎo)博(bó)主的作品已(yǐ)经获(huò)得了大量的浏览量,“viggo”就是(shì)其中之一,他(tā)用朋(péng)友的(de)照(zhào)片直接带她们走进(jìn)动(dòng)漫世界(jiè)。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业(yè)?_黑料(liào)正能量(liàng)

viggo先用StableDiffusion图(tú)片(piàn)转文(wén)字(zì)。

再用(yòng)Text2Prompt插(chā)件拓展找到对(duì)应(yīng)的关(guān)键词;最后用ControlNet插件绑定骨骼开始(shǐ)换关键词试效果。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料正能(néng)量(liàng)

通(tōng)过图(tú)片就可以看出来,效果十分惊艳。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

ChatGPT之后又(yòu)一(yī)应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期(qī),将(jiāng)洗牌科技行业?_黑料正能(néng)量(liàng)

更厉害的是,除了真实的(de)照片,草图也可以加上(shàng)“魔法”,知(zhī)乎大(dà)牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还能实现(xiàn)线(xiàn)稿转(zhuǎn)全彩图(tú)。大神(shén)张吕敏其本尊也亲(qīn)自回应。

ChatGPT之后(hòu)又一应(yīng)用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗(xǐ)牌科技行业?_黑料(liào)正能量(liàng)

不得不(bù)说当下AIGC已经变得越来越强大(dà),甚至输(shū)出(chū)的作品都(dōu)已经(jīng)能(néng)以假(jiǎ)乱真了。

02

难辨虚(xū)实,AIGC技(jì)术力爆(bào)发

警惕安全(quán)问题(tí)

近日(rì),“苏州(zhōu)金(jīn)鸡湖有游艇party”的消息火遍网络(luò),而经过警方辟(pì)谣这所谓的(de)“party”可能是(shì)全国第一起AI绘图诈骗。

由于这个(gè)活(huó)动里(lǐ)面给出的美女照片(piàn)都是(shì)AI制作的真人照(zhào)片(piàn)绘图,因为太逼真,被大家当成真事(shì)传播(bō)了

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料(liào)正能量

不(bù)过仔细观察可以发(fā)现(xiàn),活动发起者提供的照片中有个很大的漏洞可以发现并(bìng)非真人(rén),而(ér)是AI绘图,那便是图(tú)片中女(nǚ)性的手指(zhǐ)部分有(yǒu)的存在(zài)异常。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料(liào)正(zhèng)能量

有行业(yè)人事(shì)表(biǎo)示:“现在因(yīn)为手指部分的绘画算法比(bǐ)较(jiào)复杂,AI还不(bù)太(tài)会画人的手(shǒu),但最(zuì)新看到的图(tú)片(piàn)已经有越来越(yuè)完(wán)美的AI模型出现,以后可能(néng)就完全没有漏洞了(le)。

类似的(de)AI作图诈(zhà)骗在(zài)国外也已有发生。据英国广播公司报道,土耳其(qí)地震期(qī)间,有(yǒu)Tiktok用户(hù)使(shǐ)用AI合(hé)成了儿童受灾的假照片发布(bù)到网(wǎng)络,以此诱骗(piàn)善良的人(rén)打赏(shǎng)“捐助”从而实施诈骗。

目前随(suí)着技(jì)术发(fā)展(zhǎn),AIGC已经(jīng)能做出(chū)真人照片(piàn)般的绘图(tú)效果,如果(guǒ)这样的图片被(bèi)用来诈(zhà)骗(piàn),将非常可怕。

此外AIGC还引发了很多担忧,一方面,批判(pàn)者认为AI在“学习”了(le)大量(liàng)前人的作品之后,其创作没有任(rèn)何情绪和灵魂,难(nán)以和人(rén)类的艺术创作(zuò)相(xiāng)提(tí)并论。

另一方面(miàn),AIGC背(bèi)后的版权(quán)、目前都(dōu)并没有得到(dào)有效的解决,还有AIGC会不(bù)会代替人类“至(zhì)高无上”的创意。

马斯克也强调(diào),人(rén)工智(zhì)能的安全问题需要(yào)得到重(zhòng)视,太晚(wǎn)就来不(bù)及了(le)。

03

AIGC下一站除了视频,还有远方

技术(shù)都(dōu)是有两面性的,潜在的危(wēi)害(hài)并(bìng)不能掩盖其光(guāng)辉的贡献。现在看(kàn)来,人(rén)工智能技术将是(shì)第四次工(gōng)业革(gé)命(mìng)的核心驱动力量,将创造新的增长奇迹。

过去一年(nián),人工(gōng)智能在技术和商业(yè)层面都有了巨大进展,AI绘画就是人工智能技术(shù)发(fā)生方向性改变的一个(gè)代表。其下一站(zhàn)或许就是视(shì)频。

此前,Meta和谷(gǔ)歌先后发布了(le)几条引爆科(kē)技圈的短视(shì)频。这些(xiē)视频引发关注并非内容做得多优秀(xiù),反而都非(fēi)常简单,比(bǐ)如一匹正在喝水(shuǐ)的马,一(yī)只画画的(de)玩(wán)具熊,或者(zhě)一段骑(qí)摩托车(chē)的第一视角录像,随(suí)便一(yī)个有手机(jī)的人(rén)都(dōu)可以随手录下一(yī)段。

ChatGPT之(zhī)后又一应用(yòng)杀(shā)疯了(le),AIGC或进入可控(kòng)期,将洗(xǐ)牌(pái)科技行业?_黑料正能量

但这些(xiē)短视频的创作方式非常简(jiǎn)单,创作者仅仅(jǐn)需(xū)要向AI输入一段话(huà),甚至只是说一下要求,AI就可(kě)以根据需要生成(chéng)一段视频(pín)。

谷歌发布的(de)两个AI生成视频(pín)分(fēn)别(bié)来自(zì)于Imagen Video和Phenaki,前者主(zhǔ)要突出的(de)是高清,与Meta的Make-A-Video没(méi)有(yǒu)太多的差别。

在Make-A-Video公布了AI生成(chéng)的视频(pín)后,AI圈(quān)就已经(jīng)玩(wán)了一波梗,一个能够做出更高清视频的(de)AI还(hái)不(bù)足以在短时间内戳中(zhōng)兴奋点。

Phenaki更加令人震惊的地方在于,它可以制作(zuò)出超过2分(fēn)钟的连贯的(de)也(yě)有(yǒu)确切内容(róng)的视频,这才(cái)是(shì)真正让人们感(gǎn)到惊喜(xǐ)的地(dì)方(fāng)。因为无论AI生(shēng)成(chéng)的视频多么高清,也只能是(shì)为内容生产(chǎn)者提供一个灵(líng)感,一个素材,一(yī)个过场(chǎng)动画。

不过能够制(zhì)作出有具(jù)体剧情内容(róng)的视频就意(yì)味着,一些(xiē)视频(pín)创作(zuò)由AI代替人工完成已经初步有了可(kě)能。

当下AI的发(fā)展速度(dù)已经超过大部分人(rén)的想象。内容产(chǎn)业的本质是供给创(chuàng)造需求(qiú),AIGC作为全新(xīn)的内容生产方式,可以为内(nèi)容产(chǎn)业(yè)带(dài)来更(gèng)新的(de)内(nèi)容风(fēng)格、更快(kuài)的(de)生产速(sù)度(dù),更低的生产成本,这无疑(yí)会(huì)驱动内容产业的大爆发。

除了(le)AI绘图、视频,AIGC技术还(hái)能应(yīng)用于(yú)音(yīn)乐、代码、机器(qì)人动作等多种内容形式的生成。不难发现该项技术不仅在游戏等(děng)行业(yè)能得到有效应用,对于下一代互联网(wǎng)各种(zhǒng)元(yuán)素的构(gòu)建亦有关键意义(yì)。

从商业化的(de)角度来(lái)看,文化娱乐、教育(yù)、传(chuán)媒等诸(zhū)多领(lǐng)域,本(běn)身就对基(jī)于AI的可(kě)视化内(nèi)容(róng)有强烈需(xū)求。

因此,AI绘画及视频(pín)或不是结(jié)果,而只是AI进程中的(de)一(yī)块重要(yào)拼图,有(yǒu)望在技术更新的加(jiā)持下实现更大(dà)的应用价值。

AI从(cóng)理解内(nèi)容(róng),走向了可(kě)以生成内容,甚(shèn)至(zhì)能够创造出独立价(jià)值(zhí)和独立视角的内容。AIGC的再(zài)次出圈(quān),更代表着(zhe)未来的先进生产力即将到来。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技(jì)行业?_黑(hēi)料正能(néng)量

04

紧抓大模(mó)型与算力,牢固AIGC底座

从技术的(de)发展也(yě)可以看出,在语言大模型、图像大模型之(zhī)后,多模态大模(mó)型(xíng)已经成(chéng)为了(le)新的(de)趋(qū)势。

大模型被誉(yù)为当前(qián)人(rén)工智能(néng)发展的智能底座,是全球竞争最激烈的研究方向之一,包括(kuò)谷歌、亚马(mǎ)逊、百度、阿里(lǐ)、腾讯等众多头部企业都在竞(jìng)相发力(lì)。

不过(guò)训练大模(mó)型(xíng)的确价格不菲(fēi),以国盛证券发布的《ChatGPT需要多(duō)少算力》报告估算(suàn),GPT-3训练一(yī)次的成本约(yuē)为140万美元(yuán)。而对于一(yī)些更大的(de)LLM(大型(xíng)语言模型),训练成本(běn)则介于200万美元至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的(de)独立访客平均数1300万计算,其对(duì)应(yīng)芯(xīn)片(piàn)需求为3万多(duō)片英伟达A100 GPU,初始(shǐ)投入成(chéng)本约为8亿(yì)美(měi)元,每日仅电费就在(zài)5万美元左右。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

此外不(bù)论是ChatGPT还(hái)是(shì)AIGC,都离不开庞大(dà)算力支持。在关注各类大模型的发展同时,更应该关注算力(lì)网络的建设(shè)。

算力网络(luò)正驱动AI产(chǎn)业(yè)发展(zhǎn)进(jìn)入史诗级加速进程,让AIGC及通用AI这一人工智能发(fā)展的(de)终极(jí)目标离得更近。

因为算力(lì)可以对突破性技(jì)术创(chuàng)新提供(gōng)大力(lì)的(de)支持(chí)。这方面(miàn),多模态大模型是典型。作为面(miàn)向(xiàng)未来强人工智(zhì)能、通用人工智能的重要技术创新,多模态(tài)大模型已经在人工智(zhì)能(néng)领(lǐng)域提出了很多年,业(yè)界也(yě)有不少(shǎo)技术突破,但是(shì),多模态大模型(xíng)进一(yī)步往下走,算(suàn)力(lì)需求呈几何式上升(shēng),一(yī)般的算(suàn)力基(jī)础设施很快将难(nán)以(yǐ)胜(shèng)任。

从图像、文字(zì)、语音单独一项的训练,到(dào)双模态、三模态的(de)跃迁,让人工(gōng)智能可以灵活应对不同模态的转化、像人与世界交互一(yī)样(yàng)自然(rán),这方(fāng)面,由算力网络来驱动(dòng)将有(yǒu)明显优势。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或(huò)进(jìn)入(rù<span style='color: #ff0000; line-height: 24px;'>现实中真的可以把人玩坏吗</span>)可控期,将洗牌科技(jì)行业?_黑(hēi)料正(zhèng)能量

此外,还有很多需要爆发式增长的算力来支撑的技术创新,将(jiāng)在人(rén)工智能算(suàn)力网络支撑(chēng)下快速推进。

AIGC已经露出曙光,期待在大模型和(hé)大算力的支(zhī)持下AIGC能持续颠覆(fù)内容生产的方式,将(jiāng)创造的边际成(chéng)本降低(dī),让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 现实中真的可以把人玩坏吗

评论

5+2=