橘子百科-橘子都知道橘子百科-橘子都知道

你有一双会说话的眼睛什么歌曲 你有一双会说话的眼睛是谁唱的

你有一双会说话的眼睛什么歌曲 你有一双会说话的眼睛是谁唱的 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆以来,微软公司创(chuàng)始(shǐ)人比尔·盖(gài)茨已多次(cì)公开谈论人工智能话题(tí)。在(zài)最(zuì)近的一次采访中,他再次表示:“AI可(kě)能会让科技(jì)行业迎来一次剧(jù)烈(liè)的洗牌”。

这个(gè)结论是他在当(dāng)地时间2月20日(rì)接受《In Good Company》节目专访时提出(chū)的。

他预期,AI的(de)发展可能(néng)会威胁到谷歌的(de)市占率,因为微软(ruǎn)在AI方面的行动相当迅速。而最(zuì)终科(kē)技巨头将把AI整(zhěng)合成(chéng)用户的“全(quán)能助手”,包揽(lǎn)一切应用,与人们进行(xíng)沟通(tōng)并提供(gōng)建议,可以取代亚马逊、Siri或(huò)Outlook等应用(yòng)。

大佬口中全能(néng)助手的(de)到来可能尚需(xū)时日(rì),但由ControlNet引(yǐn)发的又一(yī)次AI绘(huì)画浪潮(cháo),让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之(zhī)后又(yòu)一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料正能量

01

ControlNet颠(diān)覆AI绘(huì)画新玩法(fǎ)

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还是2022年8月,在美(měi)国科罗拉多(duō)州举办的新(xīn)兴数字(zì)艺术家竞赛(sài)中,一幅名为(wèi)《太(tài)空歌剧(jù)院》的作(zuò)品(pǐn)获奖。

随后各大厂(chǎng)商的AI绘(huì)画软件被广大网友熟知(zhī)并体验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

用户(hù)们可以在应用中输(shū)入一组关键词或者一张照片,就(jiù)能获得一幅(fú)AI创作(zuò)的画(huà)作。

作画的关键(jiàn)就是所输(shū)入的(de)文本。同一组关键词也可以(yǐ)创(chuàng)作(zuò)出很多张风(fēng)格不一样的画作,这(zhè)让创作的过(guò)程就像开盲盒。

很(hěn)多用户很喜欢(huān)这种不确定的惊喜,他(tā)们会将(jiāng)生成的美图当做头像。而另一(yī)部分喜欢(huān)翻看(kàn)AI绘(huì)画(huà)的“翻车”作品。在社交媒(méi)体上,许多用户分(fēn)享(xiǎng)AI“翻车现(xiàn)场(chǎng)”,例如,一位(wèi)网友的小狗照片被(bèi)AI画(huà)成了“肌肉(ròu)男”,还有网友(yǒu)的个人(rén)照片被AI识别成了建筑。

而如(rú)今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料正能(néng)量

ControlNet是一位(wèi)正(zhèng)在斯坦福读博的中国人张吕敏(mǐn)创(chuàng)作的一种基于控制点的图像(xiàng)变形算法,主要用于数(shù)字(zì)图像处理、计算机(jī)视觉和计算机图形学(xué)等领域。

其SD插件(jiàn)一经发布,在短短的两天内便成为了AI绘画领(lǐng)域(yù)最(zuì)新的热点。

在此(cǐ)之前,大(dà)家用了很多方法(fǎ)想让AI生成的结果尽可能的符合要求,但是都不尽(jǐn)如人(rén)意,它的出现代(dài)表(biǎo)着(zhe)AI生成开始进入真(zhēn)正的(de)可控时期。

因为ControlNet可以(yǐ)直(zhí)接提取画(huà)面的(de)构图,人物的姿势和(hé)画面的深度信(xìn)息等。有了它的帮助,就不用频繁的用提示(shì)词来碰运气(qì),抽盲盒式的创作了。

通俗的说Contro你有一双会说话的眼睛什么歌曲 你有一双会说话的眼睛是谁唱的lNet相当于给AI绘画加了“魔法(fǎ)”,不少博主的作品已(yǐ)经(jīng)获得(dé)了大量的浏览量(liàng),“viggo”就是其中之一,他(tā)用朋友(yǒu)的照片直接带她们走进动漫世界。

ChatGPT之后又(yòu)一应用(yòng)杀疯了(le),AIGC或进入可控期(qī),将(jiāng)洗牌科(kē)技行业?_黑(hēi)料正能(néng)量(liàng)

viggo先用StableDiffusion图片(piàn)转(zhuǎn)文字。

再用Text2Prompt插件拓展找到对应的(de)关键词;最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始换关(guān)键词试效果(guǒ)。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能(néng)量

通过图片就可以看出来,效(xiào)果十分惊艳(yàn)。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能(néng)量(liàng)

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量(liàng)

更厉(lì)害的是(shì),除了(le)真(zhēn)实的照片,草图也可以加上“魔法(fǎ)”,知乎(hū)大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还能实(shí)现线稿转全(quán)彩图。大神张(zhāng)吕敏其本尊也亲自回(huí)应。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌科技行业(y<span style='color: #ff0000; line-height: 24px;'>你有一双会说话的眼睛什么歌曲 你有一双会说话的眼睛是谁唱的</span>è)?_黑料正能量

不(bù)得不(bù)说当(dāng)下AIGC已经变得越来(lái)越强大,甚(shèn)至输(shū)出的(de)作品都已经能以假(jiǎ)乱真了(le)。

02

难(nán)辨虚实(shí),AIGC技术力爆发(fā)

警惕安全问题

近日,“苏州金鸡湖(hú)有(yǒu)游艇party”的消息火(huǒ)遍网络,而经过警方辟谣这(zhè)所谓的“party”可能是全国第(dì)一起AI绘(huì)图诈骗。

由于(yú)这个(gè)活(huó)动里面给出(chū)的美女照(zhào)片都是AI制作的真(zhēn)人照片绘图(tú),因为太逼真(zhēn),被(bèi)大家(jiā)当成真事传播(bō)了(le)

ChatGPT之后又(yòu)一(yī)应(yīng)用杀(shā)疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科(kē)技行业?_黑料正能(néng)量

不(bù)过仔细观察可(kě)以发现,活动发起者提供的(de)照片中有个(gè)很大的漏洞可以发现并(bìng)非真(zhēn)人,而(ér)是AI绘图,那便是(shì)图片中女(nǚ)性的手(shǒu)指部分有的存(cún)在异(yì)常。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行业?_黑料正能量

有行(xíng)业人事表示:“现在(zài)因为手指部分(fēn)的绘画算法比较复杂,AI还不太会画(huà)人的手,但(dàn)最新看到(dào)的图(tú)片已(yǐ)经有越来越完(wán)美的AI模型(xíng)出现,以后(hòu)可能就完(wán)全没有(yǒu)漏洞了。

类(lèi)似的AI作图诈骗在国外也已有(yǒu)发生。据英国广播(bō)公(gōng)司(sī)报(bào)道,土(tǔ)耳其地震期间,有Tiktok用户使用AI合(hé)成了儿(ér)童受灾的假照片(piàn)发布到网(wǎng)络,以此(cǐ)诱骗善良的人打赏(shǎng)“捐助”从(cóng)而实(shí)施(shī)诈骗。

目(mù)前随着技(jì)术发展,AIGC已(yǐ)经能做出真人照(zhào)片般的绘图效果,如果这样的(de)图片(piàn)被用来诈(zhà)骗,将(jiāng)非(fēi)常(cháng)可(kě)怕。

此外AIGC还引发了很多(duō)担(dān)忧,一方面,批判者(zhě)认(rèn)为AI在“学(xué)习(xí)”了大(dà)量前人的作品之后,其(qí)创(chuàng)作没有任何情绪(xù)和灵魂,难以和人类的艺术创(chuàng)作相提(tí)并论(lùn)。

另一(yī)方面,AIGC背后的版权、目(mù)前(qián)都(dōu)并没有得到有效的解决,还有AIGC会不会代替人类“至高无上”的创意。

马斯克(kè)也强调,人工智(zhì)能的安全问题需要得到重视,太晚就来不(bù)及了。

03

AIGC下(xià)一站除了视频(pín),还有远方

技(jì)术都(dōu)是(shì)有两面性(xìng)的(de),潜(qián)在的(de)危害并不(bù)能掩盖其(qí)光(guāng)辉(huī)的贡献。现(xiàn)在看(kàn)来,人工智能技术将(jiāng)是(shì)第四次工业革命的核心驱动力量,将创(chuàng)造新的增长奇迹。

过去一年,人工(gōng)智(zhì)能在技术和商业(yè)层面都有了巨大进(jìn)展,AI绘画就是人工(gōng)智能技术发生方向性改变的(de)一个(gè)代表。其(qí)下(xià)一站或(huò)许就是视频(pín)。

此前,Meta和谷歌先后发布了几(jǐ)条(tiáo)引(yǐn)爆科技圈(quān)的短视(shì)频。这些视频(pín)引发关注并非内容做得多优秀,反而都非常简单(dān),比(bǐ)如一匹正在喝水的马(mǎ),一(yī)只画(huà)画的玩具熊,或者一段骑摩(mó)托车(chē)的第一视(shì)角录像,随便一个有手机的人都可以随手录(lù)下一段。

ChatGPT之后又(yòu)一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑料正能(néng)量

但这些短视频的创作方式(shì)非常简单,创作者仅仅需要向(xiàng)AI输(shū)入一(yī)段话,甚至只(zhǐ)是说一下要(yào)求,AI就可以根(gēn)据需要生成(chéng)一段视频。

谷歌发(fā)布的(de)两个AI生成视频分别(bié)来(lái)自于Imagen Video和Phenaki,前者主(zhǔ)要突出的是高清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布了(le)AI生成的视频后,AI圈就(jiù)已经玩了一(yī)波梗,一(yī)个能(néng)够做出更高(gāo)清视频(pín)的(de)AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更加令(lìng)人(rén)震(zhèn)惊的地方在于,它可(kě)以(yǐ)制作出超过(guò)2分钟的连贯的也(yě)有确切内容的(de)视频,这才是真正让人(rén)们感到惊喜的(de)地方。因为(wèi)无论AI生成的视(shì)频多(duō)么高清,也只能是为内容(róng)生产者提供(gōng)一个灵感,一个素(sù)材(cái),一个过场动画(huà)。

不(bù)过能(néng)够(gòu)制作出有具体剧情内(nèi)容的视频就(jiù)意味着,一(yī)些视(shì)频创作由(yóu)AI代替人工完成已经初步有了可能。

当(dāng)下AI的发展速度已经(jīng)超过大部分(fēn)人(rén)的想象。内容产业的本质是供给创造需(xū)求,AIGC作为全新的内容生产(chǎn)方式,可以为内容产业(yè)带来更新的内(nèi)容(róng)风格、更(gèng)快(kuài)的生(shēng)产速(sù)度,更低的生(shēng)产成本,这无疑会(huì)驱动(dòng)内(nèi)容产(chǎn)业(yè)的大(dà)爆发。

除了AI绘图、视频,AIGC技术(shù)还能应用于音(yīn)乐、代(dài)码(mǎ)、机器人动(dòng)作等多种内容形式的生成(chéng)。不难发(fā)现该项技(jì)术不仅在游戏等行业(yè)能得到有效应(yīng)用(yòng),对于下一(yī)代(dài)互联网各(gè)种元素的构建亦(yì)有关键意(yì)义。

从商业化的(de)角度来看,文化娱乐(lè)、教育、传媒等诸多(duō)领域,本身就(jiù)对基于AI的(de)可(kě)视化内容(róng)有(yǒu)强烈(liè)需(xū)求。

因此,AI绘画及视频(pín)或不是结果,而只是AI进程中的一(yī)块(kuài)重要拼图(tú),有望在技术(shù)更(gèng)新的加持下实现(xiàn)更大的应用价值。

AI从理解内(nèi)容,走向了可以生成内容,甚至(zhì)能够创造出独立价值和独立(lì)视角的内(nèi)容。AIGC的再次出(chū)圈,更代(dài)表(biǎo)着未来(lái)的先进生产力即将到来(lái)。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑料正能(néng)量

04

紧(jǐn)抓(zhuā)大模型与算(suàn)力,牢固AIGC底座

从技术的发展(zhǎn)也可以看出,在语言大模型、图像大(dà)模型之后,多模态大模型已经成为了(le)新的趋势。

大模型被誉为当前人工(gōng)智能发展(zhǎn)的智能底座,是全球(qiú)竞(jìng)争最激(jī)烈的研究方向之一,包括(kuò)谷歌、亚马逊、百度、阿里、腾讯等众多(duō)头部企业都(dōu)在(zài)竞相(xiāng)发力(lì)。

不过训练大模型的(de)确(què)价(jià)格不菲(fēi),以国盛证券发布的《ChatGPT需(xū)要多少(shǎo)算力(lì)》报(bào)告估算,GPT-3训练一次的成本约为(wèi)140万美元(yuán)。而对于一些更大的LLM(大(dà)型(xíng)语言模型),训练(liàn)成本则介于(yú)200万美(měi)元至(zhì)1200万美元(yuán)高价之间(jiān)。

以ChatGPT在2023年1月的独立(lì)访(fǎng)客平均数(shù)1300万计(jì)算,其(qí)对应芯片(piàn)需(xū)求为3万多片英伟达A100 GPU,初(chū)始投入成本(běn)约为8亿美元,每(měi)日仅电费就(jiù)在5万美元左右。

ChatGPT之后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量(liàng)

此外不论是ChatGPT还是AIGC,都离不开庞大算力支持。在关(guān)注各类大模型的发展(zhǎn)同时,更应(yīng)该关注(zhù)算力网络的建设。

算(suàn)力网络正驱(qū)动(dòng)AI产业发展进(jìn)入史(shǐ)诗级加速进程,让AIGC及通用AI这一(yī)人工智能发展的终极目标(biāo)离得更近。

因为算力(lì)可(kě)以(yǐ)对突破性(xìng)技术(shù)创新提(tí)供大力(lì)的支持。这方(fāng)面,多(duō)模态大模型是(shì)典型(xíng)。作(zuò)为面向未来强人工智能、通用人工智能的重(zhòng)要(yào)技术创新,多(duō)模态大模型已(yǐ)经在人工智能领域提(tí)出了很多年,业界(jiè)也有不(bù)少技术突破,但是,多模态大模型进一步(bù)往(wǎng)下走(zǒu),算力需求呈几(jǐ)何(hé)式上升,一(yī)般的算力基(jī)础设施(shī)很(hěn)快将难以(yǐ)胜(shèng)任。

从图像、文字、语音(yīn)单独一项的训(xùn)练,到双(shuāng)模态(tài)、三模(mó)态的跃迁(qiān),让人工智(zhì)能可以灵活应对不同模态的转化、像(xiàng)人与世界交(jiāo)互一样自然,这方面,由(yóu)算力网络来驱动将(jiāng)有明显优势。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

此外,还有(yǒu)很多需要爆发(fā)式增长的算力来支(zhī)撑的技(jì)术创新,将在人(rén)工智能算(suàn)力网(wǎng)络支(zhī)撑(chēng)下快速推进。

AIGC已经露出曙光,期待在大模型和大算力的支持下AIGC能持续颠(diān)覆内容生产的方式,将创造的边(biān)际(jì)成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 你有一双会说话的眼睛什么歌曲 你有一双会说话的眼睛是谁唱的

评论

5+2=