橘子百科-橘子都知道橘子百科-橘子都知道

每走一步就会深深的撞一下,抱着走一下就撞一下

每走一步就会深深的撞一下,抱着走一下就撞一下 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器人ChatGPT火(huǒ)爆以(yǐ)来(lái),微软公司创始(shǐ)人比尔·盖茨已多次公开(kāi)谈论人工智能(néng)话题。在最近(jìn)的(de)一次采访中,他(tā)再次(cì)表示:“AI可能会让科技行业迎来一次剧(jù)烈的洗牌”。

这个结论是他在当地时间(jiān)2月(yuè)20日(rì)接(jiē)受《In Good Company》节目专访时提(tí)出的。

他预期,AI的发展可能会威胁到谷(gǔ)歌的市占率,因为微软在AI方面的行动相当迅速(sù)。而最(zuì)终科技巨头将把AI整合成用(yòng)户(hù)的“全能助手”,包揽(lǎn)一切应用,与人们进行沟通并提供建(jiàn)议,可以取代(dài)亚(yà)马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可(kě)能尚需时(shí)日,但由ControlNet引发的又一次(cì)AI绘(huì)画浪(làng)潮(cháo),让AIGC在ChatGPT的话(huà)题热(rè)点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可控靠近(jìn)

以AI绘画为代表的AIGC上一次爆(bào)火的时(shí)候(hòu),还(hái)是(shì)2022年8月,在美国科罗拉多(duō)州(zhōu)举办的(de)新兴数字艺术家竞赛(sài)中,一幅名(míng)为《太空歌(gē)剧院》的作(zuò)品获奖(jiǎng)。

随后(hòu)各大厂商的(de)AI绘画软件被广大网(wǎng)友(yǒu)熟知并体(tǐ)验,Stable Diffusion便(biàn)是其中代表。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技(jì)行(xíng)业?_黑料正能量

用户们可以在应用中(zhōng)输入一组(zǔ)关键(jiàn)词(cí)或者一(yī)张照(zhào)片,就能获得(dé)一幅AI创作的(de)画作。

作(zuò)画的关键就是所输(shū)入的(de)文本。同(tóng)一组关键词也可以创作出很多张(zhāng)风格不一样的画作,这让(ràng)创作的过程(chéng)就像(xiàng)开盲(máng)盒。

很多用户很喜(xǐ)欢这种不(bù)确定的惊喜,他们会将生成的美图(tú)当(dāng)做头像。而(ér)另一部分喜(xǐ)欢翻看AI绘画的“翻车”作(zuò)品。在社交媒(méi)体上,许(xǔ)多用户分(f每走一步就会深深的撞一下,抱着走一下就撞一下ēn)享(xiǎng)AI“翻车(chē)现(xiàn)场”,例如,一位网友的(de)小狗照片被AI画(huà)成(chéng)了“肌肉男”,还有网友的个人照(zhào)片被AI识别成了(le)建筑(zhù)。

而如今随着ControlNet的出现与加持(chí),以(yǐ)往AI绘画的填写关键词游戏可(kě)能(néng)要(yào)被颠覆了。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或进入(rù)可控期(qī),将洗牌科技行业(yè)?_黑料正能量

ControlNet是一位正在斯坦福(fú)读博的中国(guó)人张吕敏创作(zuò)的一种基于控制点的图像变形算法,主要用于数字图像处理、计(jì)算机(jī)视觉和(hé)计(jì)算机图形学等(děng)领(lǐng)域。

其SD插件(jiàn)一(yī)经发布,在短短(duǎn)的两天内便(biàn)成为了AI绘(huì)画领域最新的热点。

在此(cǐ)之前,大(dà)家用了很多方法(fǎ)想让(ràng)AI生(shēng)成的结果尽可(kě)能(néng)的(de)符合(hé)要求(qiú),但(dàn)是都不尽如(rú)人意,它的出现代表着(zhe)AI生成开始进入真正的可控时期(qī)。

因为(wèi)ControlNet可以直接提取画(huà)面的构(gòu)图,人物的姿势和画面的深度信息等(děng)。有了它(tā)的帮助,就不用频繁的用提(tí)示(shì)词来(lái)碰运气,抽盲盒(hé)式的创作(zuò)了。

通俗的说ControlNet相当于(yú)给AI绘画(huà)加了“魔法”,不(bù)少(shǎo)博主的(de)作(zuò)品已经获得了大量的浏览量,“viggo”就是(shì)其(qí)中(zhōng)之一,他用朋(péng)友(yǒu)的照片直接带她(tā)们(men)走进(jìn)动漫世界(jiè)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

viggo先用StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插件拓展找到对应的关键词;最后用ControlNet插件绑定骨骼开始换关键词试效果。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑料正能量(liàng)

通过图片就(jiù)可(kě)以看(kàn)出来,效(xiào)果十分惊艳(yàn)。

ChatGPT之后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌科技行业?_黑料正能量(liàng)

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技行业?_黑料正能量

更厉(lì)害的是,除了(le)真实的照片(piàn),草图(tú)也可以加上(shàng)“魔(mó)法(fǎ)”,知乎(hū)大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还(hái)能实(shí)现线稿转全彩图。大神张吕(lǚ)敏其本尊也亲(qīn)自回应(yīng)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量每走一步就会深深的撞一下,抱着走一下就撞一下ata-type="jpeg" data-w="1174">

不得不(bù)说当下AIGC已经变得(dé)越来(lái)越强(qiáng)大,甚至输出的作品(pǐn)都已经能(néng)以假乱(luàn)真了。

02

难辨虚实,AIGC技(jì)术力爆发(fā)

警惕安(ān)全问题

近日(rì),“苏州(zhōu)金鸡湖有游艇party”的消息(xī)火(huǒ)遍(biàn)网络,而经过警方辟(pì)谣(yáo)这所谓(wèi)的(de)“party”可能(néng)是全国(guó)第一起AI绘图诈骗。

由(yóu)于这个(gè)活动里面给出的美(měi)女照片都是AI制作(zuò)的(de)真人照片(piàn)绘(huì)图,因为(wèi)太逼真,被大家当成真事传(chuán)播了(le)

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑(hēi)料正能量(liàng)

不(bù)过仔细观察可以(yǐ)发现,活动发(fā)起者提供的照片中有个很(hěn)大的漏(lòu)洞(dòng)可以(yǐ)发(fā)现并非真(zhēn)人,而是AI绘(huì)图,那便是图片中女性的手(shǒu)指部分有的(de)存在异常。

ChatGPT之(zhī)后又一(yī)应用杀疯(fēng)了(le),AIGC或(huò)进入(rù)可控期,将洗牌科技行业?_黑料正能量

有行业人事表(biǎo)示:“现在(zài)因为手(shǒu)指部分的绘画算法比较复杂,AI还不太(tài)会画人的(de)手(shǒu),但(dàn)最新看(kàn)到的图(tú)片已经(jīng)有越来越完美的AI模型出现,以后可能就完全没(méi)有漏洞了(le)。

类似的AI作图(tú)诈骗在国外(wài)也已(yǐ)有发生(shēng)。据英国(guó)广播公司报道,土(tǔ)耳其地(dì)震(zhèn)期(qī)间,有Tiktok用户(hù)使用AI合成了儿童受灾(zāi)的假(jiǎ)照(zhào)片发(fā)布到网络,以此诱骗善良的(de)人(rén)打赏(shǎng)“捐(juān)助”从(cóng)而实施诈骗(piàn)。

目前随着(zhe)技术发展,AIGC已经能做出真人照片(piàn)般的绘图效果,如果这样的图片被用来诈骗,将非常可怕。

此外AIGC还引发了很多担忧,一(yī)方面,批判者认为AI在“学(xué)习”了(le)大量前人的作品之后,其创作没有任何情绪(xù)和灵魂,难以和人类(lèi)的艺(yì)术创作(zuò)相提并论。

另一方面(miàn),AIGC背后的版权、目前都并(bìng)没有得到(dào)有效的(de)解决,还有AIGC会不(bù)会代替人类“至高无上”的创意。

马斯(sī)克(kè)也强调(diào),人工智能的安全问题(tí)需要得到(dào)重视,太(tài)晚就来(lái)不及了。

03

AIGC下一站除了视频,还(hái)有远方(fāng)

技术(shù)都是有两面性的,潜在(zài)的危害并不能掩(yǎn)盖其光辉的贡献。现在看来(lái),人工智能技术将(jiāng)是第四次工(gōng)业革命(mìng)的核心(xīn)驱(qū)动(dòng)力量,将(jiāng)创造新(xīn)的增(zēng)长(zhǎng)奇迹。

过去一年,人工(gōng)智(zhì)能(néng)在技术和(hé)商业层面(miàn)都有了巨大进(jìn)展,AI绘(huì)画(huà)就(jiù)是人工(gōng)智能技术发生方向性改变的(de)一个代表。其下一(yī)站或许就是视频。

此前,Meta和谷歌(gē)先(xiān)后发(fā)布了几条引爆(bào)科技圈的短视频。这些视频引发关注并非内容做(zuò)得多优(yōu)秀(xiù),反而都非(fēi)常简单,比如一(yī)匹正在喝水的(de)马,一只(zhǐ)画画(huà)的玩(wán)具熊,或者(zhě)一(yī)段骑摩托(tuō)车的第一视(shì)角录像,随便一个(gè)有手机的人都可以随手(shǒu)录下一段。

ChatGPT之(zhī)后又一(yī)应用杀疯了(le),AIGC或进(jìn)入可控期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

但这些短视频的创作(zuò)方式(shì)非常简单,创作者仅仅需要向AI输(shū)入(rù)一段话,甚至(zhì)只(zhǐ)是说(shuō)一(yī)下要求,AI就可以根据需(xū)要生成一段视频。

谷歌(gē)发布的两个AI生成视(shì)频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公(gōng)布了AI生成的(de)视频(pín)后,AI圈就已经(jīng)玩了(le)一波(bō)梗,一个能够做出更高清视频(pín)的AI还不足以在短时(shí)间内戳中兴奋点。

Phenaki更(gèng)加令人震惊的地(dì)方在于,它(tā)可(kě)以制作(zuò)出超(chāo)过2分(fēn)钟的连(lián)贯的(de)也(yě)有确切内(nèi)容(róng)的视频,这才是(shì)真正让人们(men)感到惊喜(xǐ)的地方。因为(wèi)无论AI生成(chéng)的视频多么高清,也只能(néng)是(shì)为(wèi)内容生产者提(tí)供一个(gè)灵感,一个素材,一个过场动画。

不过能够制作出有具(jù)体剧情内(nèi)容的(de)视频就意味着,一些视(shì)频(pín)创作由(yóu)AI代(dài)替人工完成已经初步有了可能。

当(dāng)下AI的(de)发(fā)展速度已经超过大部分人的想象。内容产业的本(běn)质(zhì)是供(gōng)给创造需求,AIGC作为(wèi)全新的内容生产(chǎn)方式,可以为内容产业带来更新的内容风格、更(gèng)快的生产速度,更低(dī)的生产(chǎn)成本(běn),这无疑会驱(qū)动内容产(chǎn)业的大爆发。

除了(le)AI绘图(tú)、视频(pín),AIGC技(jì)术还能应用于(yú)音乐、代码、机器人动作等多种内容形式的生成(chéng)。不难发现该项技术不仅在(zài)游戏等行业能得到有效应用,对(duì)于下一代(dài)互(hù)联网各种元素的(de)构建亦有关键意义(yì)。

从商业化的(de)角度来(lái)看,文化(huà)娱(yú)乐、教(jiào)育、传媒等诸多领域,本身就对基于AI的(de)可视化内容有强烈需求。

因此,AI绘画及(jí)视频或不是结果,而只是AI进程中(zhōng)的一(yī)块重要拼图,有望在技术更新的加持(chí)下实现更大(dà)的应用价值(zhí)。

AI从理解内容,走向了可以(yǐ)生成内容(róng),甚至能够(gòu)创造出(chū)独立价值(zhí)和独立视角(jiǎo)的内容(róng)。AIGC的再次出圈,更代表着(zhe)未来的先进生(shēng)产力即将到来。

ChatGPT之(zhī)后又一应(yīng)用杀疯(fēng)了(le),AIGC或(huò)进入可控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

04

紧抓大模型与算力,牢固AIGC底座

从技(jì)术的发(fā)展也可以看(kàn)出,在语言大模型(xíng)、图像(xiàng)大模(mó)型之(zhī)后,多模态大模型已经成为了(le)新的(de)趋(qū)势。

大模型(xíng)被誉为当前(qián)人工智(zhì)能发展的智能底座,是全(quán)球竞争最激(jī)烈的研究方向之(zhī)一,包括谷(gǔ)歌、亚马逊、百度、阿里、腾讯等众多头部企业都在竞相发力(lì)。

不(bù)过训(xùn)练大(dà)模型的(de)确价格不(bù)菲(fēi),以(yǐ)国盛证券发布的(de)《ChatGPT需(xū)要多少算力》报告估算(suàn),GPT-3训练一(yī)次的成本约为(wèi)140万美元。而(ér)对(duì)于一些更大的LLM(大型语言模型(xíng)),训练(liàn)成本则介于200万美元(yuán)至1200万美元(yuán)高(gāo)价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立访客平均数(shù)1300万计算,其对应芯片需求为(wèi)3万多片英(yīng)伟达(dá)A100 GPU,初始(shǐ)投(tóu)入成本约为8亿(yì)美元,每日仅电费(fèi)就在5万美元左右。

ChatGPT之后又一(yī)应(yīng)用(yòng)杀(shā)疯(fēng)了(le),AIGC或(huò)进入可控期,将(jiāng)洗牌科技(jì)行业?_黑料正能量(liàng)

此外不论是(shì)ChatGPT还是AIGC,都离不开庞大算力支持。在(zài)关注各类大模型的发展(zhǎn)同时,更应该(gāi)关注算力网络的建(jiàn)设(shè)。

算(suàn)力网络正(zhèng)驱动(dòng)AI产业(yè)发展进(jìn)入(rù)史诗级加(jiā)速进程,让AIGC及通用AI这一人工智(zhì)能发展(zhǎn)的终(zhōng)极目标(biāo)离得更近。

因为算力可以对突破性技(jì)术创新提供大力(lì)的(de)支持。这方(fāng)面,多模态大模型是典(diǎn)型。作为面向未来强(qiáng)人工智能(néng)、通(tōng)用人(rén)工智能的重(zhòng)要(yào)技术创新(xīn),多模态大(dà)模(mó)型已经(jīng)在人(rén)工智能领域提出了很多年(nián),业界(jiè)也有不少(shǎo)技术突破,但(dàn)是,多模态大模型进一步往下(xià)走,算力(lì)需求呈几何式上升,一般的算力基(jī)础(chǔ)设施很快(kuài)将(jiāng)难以胜任。

从图像、文字、语(yǔ)音(yīn)单独一(yī)项的(de)训练,到双模(mó)态、三模态的(de)跃迁,让人工(gōng)智能可(kě)以灵活应对不同(tóng)模态的转化、像人与世(shì)界交互一样(yàng)自(zì)然,这(zhè)方面,由算(suàn)力网络(luò)来驱动将有(yǒu)明(míng)显优势。

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了,AIGC或进(jìn)入(rù)可控期(qī),将(jiāng)洗牌科技行业?_黑料正能量

此外,还有(yǒu)很(hěn)多需(xū)要爆发(fā)式增(zēng)长的算力来支撑的技术创新,将在人工智(zhì)能算(suàn)力网络支撑(chēng)下快(kuài)速推进。

AIGC已经露出曙光,期(qī)待在大模型和(hé)大算力(lì)的支持(chí)下AIGC能持续颠覆内容生产(chǎn)的(de)方式(shì),将创造(zào)的边际成本降低,让万众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 每走一步就会深深的撞一下,抱着走一下就撞一下

评论

5+2=