橘子百科-橘子都知道橘子百科-橘子都知道

钱塘自古繁华钱塘指的是哪个城市,钱塘指的是哪个城市的别称

钱塘自古繁华钱塘指的是哪个城市,钱塘指的是哪个城市的别称 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机(jī)器人ChatGPT火爆以(yǐ)来,微软公司(sī)创始人(rén)比尔·盖茨(cí)已多(duō)次(cì)公开(kāi)谈论人工智能话(huà)题。在最近的一次采访中,他再次(cì)表(biǎo)示:“AI可能会让科技行业(yè)迎来一(yī)次剧烈的洗牌”。

这个结论是他在当地时间2月(yuè)20日(rì)接受《In Good Company》节目专访时提出(chū)的。

他(tā)预期,AI的发展(zhǎn)可能会威胁到谷歌的市占率,因为微软在AI方(fāng)面的行(xíng)动相当(dāng)迅速。而最终科技(jì)巨头将把AI整合成用户的“全能助手”,包揽(lǎn)一切(qiè)应用,与人(rén)们进行沟通并提(tí)供(gōng)建(jiàn)议,可以(yǐ)取代亚马逊、Siri或Outlook等应用。

大(dà)佬(lǎo)口中全能助手的到来可(kě)能尚需时(shí)日,但由(yóu)ControlNet引发的又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热点(diǎn)包围中杀出重围。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控靠(kào)近

以AI绘画为代表(biǎo)的AIGC上一次爆火的时候,还是2022年8月,在美(měi)国科(kē)罗拉多州举办的新(xīn)兴数字艺术家竞赛中,一幅名为《太(tài)空(kōng)歌剧院》的作(zuò)品获奖。

随后各大(dà)厂商的AI绘画(huà)软件被广大(dà)网友熟(shú)知并体验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技(jì)行业?_黑(hēi)料(liào)正(zhèng)能量(liàng)

用户们可以在应(yīng)用中输入一组关键(jiàn)词或(huò)者一张照片,就能(néng)获得一幅AI创作的画作。

作画(huà)的关键就(jiù)是所输入的文本。同一组关键(jiàn)词也可以创作(zuò)出很多张风格不一样(yàng)的画作,这让(ràng)创作的过程就像开盲盒。

很多用户(hù)很喜欢这种不(bù)确定的惊喜,他们会将生成(chéng)的美图当做(zuò)头像。而(ér)另(lìng)一部分喜欢翻看AI绘画的(de)“翻(fān)车”作(zuò)品。在社交媒体上,许多用(yòng)户分享AI“翻(fān)车现(xiàn)场”,例如(rú),一位网友的小(xiǎo)狗照片被AI画成了“肌肉(ròu)男”,还有网友的个人(rén)照片被AI识别成了建筑。

而如今随着(zhe)ControlNet的(de)出现与加持,以往AI绘画(huà)的填(tián)写关键词游戏可能(néng)要被颠覆了。

ChatGPT之后(hòu)又(yòu)一应用杀(shā)疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量

ControlNet是一位正(zhèng)在斯坦福读博的(de)中国人张吕敏创(chuàng)作的一(yī)种(zhǒng)基(jī)于(yú)控制(zhì)点的图像变形算(suàn)法,主要用于数字(zì)图像处理、计算机视(shì)觉和计算机图形学等领域。

其SD插件(jiàn)一经发(fā)布(bù),在短短的两天内便成为了(le)AI绘画(huà)领域最新的热点。

在此之前,大(dà)家用了很多方法想(xiǎng)让AI生成(chéng)的结果尽可能的符合(hé)要求,但(dàn)是都不尽如人(rén)意,钱塘自古繁华钱塘指的是哪个城市,钱塘指的是哪个城市的别称rong>它的出现代表着AI生成开始进入真正的可(kě)控时(shí)期。

因为ControlNet可以直(zhí)接提取(qǔ)画面的构图,人(rén)物(wù)的(de)姿势和(hé)画面(miàn)的深度信息等。有了它(tā)的(de)帮助,就不用频繁的用(yòng)提示词来碰运气(qì),抽盲盒式的创作了。

通(tōng)俗的说ControlNet相当于给AI绘画(huà)加了“魔法”,不(bù)少博(bó)主(zhǔ)的作品已经获(huò)得了大量的浏览量,“viggo”就是其中之一,他用朋友的照片(piàn)直接带她们走进动漫(màn)世(shì)界。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料(liào)正能量

viggo先用StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插件拓展(zhǎn)找到对(duì)应的关键词;最后用(yòng)ControlNet插件(jiàn)绑定(dìng)骨骼开始换关键词试效(xiào)果。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进入可(kě)控期(qī),将洗牌科技行业(yè)?_黑料(liào)正能量

通过(guò)图(tú)片(piàn)就可(kě)以看出来,效(xiào)果十(shí)分惊艳(yàn)。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌科技行(xíng)业?_黑料正能量(liàng)

ChatGPT之(zhī)后又一应(yīng)用杀(shā)疯了,AIGC或进(jìn)入可(kě)控期,将(jiāng)洗(xǐ)牌科技行业?_黑料(liào)正能量

更厉害的是,除了真(zhēn)实的照片,草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介(jiè)绍到ControlNet还(hái)能实现线稿(gǎo)转全彩图(tú)。大神张吕敏其(qí)本尊(zūn)也亲自回应。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

不得不说当下AIGC已经变(biàn)得越(yuè)来越强大,甚至输(shū)出的(de)作品都(dōu)已经能以假乱真了。

02

难(nán)辨虚实(shí),AIGC技术力爆发

警(jǐng)惕安(ān)全问题

近日,“苏州金鸡(jī)湖有游(yóu)艇party”的消息火遍(biàn)网络,而经过警(jǐng)方辟谣这所谓的“party”可能是全国第一起AI绘(huì)图诈骗。

由(yóu)于这个活(huó)动(dòng)里(lǐ)面给出(chū)的美女照片都(dōu)是AI制作的真人(rén)照片绘(huì)图,因为太(tài)逼真,被大(dà)家当成真事传播了

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可(kě)控(kòng)期,将(jiāng)洗牌科技行业?_黑料(liào)正能量

不过(guò)仔细(xì)观察可以(yǐ)发现(xiàn),活动发起者提供(gōng)的(de)照(zhào)片中有个(gè)很(hěn)大的漏(lòu)洞(dòng)可以(yǐ)发(fā)现(xiàn)并非真人,而是AI绘(huì)图,那便是图(tú)片中女性的手指(zhǐ)部分有的存在异常(cháng)。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控(kòng)期,将洗牌科(kē)技行业?_黑料正能(néng)量

有行业人(rén)事(shì)表示:“现在(zài)因为(wèi)手指(zhǐ)部分的绘画算法比较复杂,AI还不太会画人的(de)手,但最新看到的图片已(yǐ)经有越(yuè)来越(yuè)完美的AI模型出现,以(yǐ)后可(kě)能就完全没(méi)有漏洞了。

类(lèi)似的AI作(zuò)图诈骗(piàn)在国外也已有发生(shēng)。据英国广播公司报道,土耳其地震期间,有Tiktok用(yòng)户使用AI合成了儿童受灾的假照片(piàn)发布到网络,以此诱骗善良的人打赏“捐助”从而实施诈骗。

目(mù)前随着技术发(fā)展,AIGC已经能做出(chū)真人照(zhào)片(piàn)般的绘图效果,如果这样的图片被(bèi)用来诈骗,将非常可怕。

此外AIGC还(hái)引发了很多担(dān)忧(yōu),一(yī)方面,批判者认(rèn)为AI在“学习(xí)”了大(dà)量前人的作品之(zhī)后,其创作没(méi)有任何情绪和灵(líng)魂,难(nán)以(yǐ)和(hé)人类的艺术创(chuàng)作相提并论。

另(lìng)一方面(miàn),AIGC背后(hòu)的版(bǎn)权、目前都并(bìng)没有得到(dào)有效的解决,还有AIGC会不会(huì)代替人(rén)类“至高(gāo)无上”的创意。

马斯克也(yě)强调(diào),人(rén)工(gōng)智(zhì)能的安全问题(tí)需要得(dé)到重(zhòng)视,太(tài)晚就来不及了。

03

AIGC下(xià)一站除了视频,还有远方

技术都(dōu)是有两面性(xìng)的(de),潜在的危害并不(bù)能掩盖其光辉的贡献。现在看来,人工(gōng)智能(néng)技术将是第四次工业革(gé)命(mìng)的核心驱动力(lì)量,将(jiāng)创(chuàng)造新的增长奇迹(jì)。

过(guò)去一年,人(rén)工(gōng)智能在技(jì)术和商业层面(miàn)都有了巨大进(jìn)展,AI绘画(huà)就是人工智(zhì)能技术发生方向性改变的一(yī)个代表。其(qí)下一站或(huò)许就(jiù)是视频。

此前(qián),Meta和(hé)谷歌先后发布了几(jǐ)条(tiáo)引爆(bào)科技圈的(de)短(duǎn)视频。这些视频引发关注并(bìng)非内容做得多(duō)优秀,反而(ér)都非常(cháng)简单,比如(rú)一匹正在喝水的(de)马,一只画画的(de)玩(wán)具熊,或者一段骑摩托(tuō)车的(de)第(dì)一(yī)视角录(lù)像,随便一个有手机的人都可以(yǐ)随手(shǒu)录下一段。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量

但这些短视(shì)频的创作方(fāng)式非(fēi)常简单,创作(zuò)者仅仅(jǐn)需要(yào)向AI输入一段话,甚(shèn)至只是说(shuō)一下要求,AI就可以根据需要(yào)生成一段(duàn)视频。

谷歌(gē)发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突(tū)出的是高(gāo)清(qīng),与Meta的Make-A-Video没有太(tài)多的差别。

在(zài)Make-A-Video公布了AI生(shēng)成的(de)视频(pín)后,AI圈就已经玩了一(yī)波(bō)梗,一个能够做出更高清视频的AI还不足以(yǐ)在短时间内戳中兴奋点。

Phenaki更加令人(rén)震(zhèn)惊的地方在于,它(tā)可以制作出超过2分钟的(de)连贯的也有确切内(nèi)容的视频,这才(cái)是真正让人们感到惊喜的地方。因为无论AI生成(chéng)的(de)视频多么(me)高(gāo)清(qīng),也只能(néng)是为(wèi)内容生产者提供一个灵感,一(yī)个素材,一个过场动画(huà)。

不(bù)过能够制作(zuò)出有具(jù)体剧情内容(róng)的视频就意味着,一些视频创作由AI代(dài)替(tì)人工(gōng)完成已经初步(bù)有了(le)可能。

当下AI的(de)发展速(sù)度已经超过大部(bù)分人的想象。内容产业的本质是(shì)供给创造需求,AIGC作为全新的内容(róng)生(shēng)产方式,可(kě)以为(wèi)内(nèi)容产(chǎn)业带(dài)来更新的内(nèi)容风格、更快的生产(chǎn)速度,更低(dī)的生产成本(běn),这(zhè)无疑会驱(qū)动(dòng)内容产业的大爆发。

除了AI绘图、视频,AIGC技术还能应(yīng)用于音(yīn)乐、代码(mǎ)、机器人动作等(děng)多种(zhǒng)内容形式(shì)的生成。不难(nán)发(fā)现该项技术不仅在游(yóu)戏(xì)等行业能得到(dào)有效(xiào)应(yīng)用,对于下一代互(hù)联网各种(zhǒng)元素的构建亦有关(guān)键意义(yì)。

从商业化的角度来看,文化娱乐(lè)、教育、传媒等诸多领域,本身就对基于AI的(de)可视化内(nèi)容有强烈需(xū)求。

因(yīn)此,AI绘画(huà)及(jí)视频或不是结果,而只是AI进程中(zhōng)的一(yī)块(kuài)重(zhòng)要拼图,有望在技(jì)术更(gèng)新(xīn)的加持下(xià)实现更(gèng)大的应(yīng)用价值。

AI从理解(jiě)内容,走向了可以生成内容,甚至能够创造出(chū)独立价值(zhí)和独立视角的内(nèi)容。AIGC的再次出(chū)圈,更代表着未来的先进生产力即(jí)将到来。

ChatGPT之(zhī)后又一应用(yòng)杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗牌(pái)科技行业(yè)?_黑料正(zhèng)能量

04

紧抓大模(mó)型与算力,牢固AIGC底座(zuò)

从(cóng)技(jì)术的发(fā)展也可以看出,在语言大模型、图像(xiàng)大模(mó)型之后,多(duō)模态大模型已经(jīng)成为了新的趋势。

大(dà)模(mó)型(xíng)被誉为当前人工智(zhì)能发(fā)展(zhǎn)的智能底座,是全球(qiú)竞争最(zuì)激烈的(de)研(yán)究(jiū)方向之一,包括(kuò)谷歌、亚马逊、百度、阿(ā)里、腾讯等众多头(tóu)部企业(yè)都(dōu)在竞(jìng)相发力(lì)。

不过训练大模型的确价格不(bù)菲,以国(guó)盛证券发布的《ChatGPT需(xū)要多少算力(lì)》报(bào)告估算,GPT-3训(xùn)练一(yī)次的成本约为140万美(měi)元。而对(duì)于一(yī)些更大的LLM(大型语言模(mó)型),训练(liàn)成本则介于200万美元至(zhì)1200万美元(yuán)高价之间(jiān)。

以ChatGPT在2023年1月的独立访(fǎng)客平均数1300万计算,其(qí)对应(yīng)芯片需(xū)求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日仅电费就在5万美元左(zuǒ)右。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

此外不论是(shì)ChatGPT还(hái)是AIGC,都离不(bù)开庞(páng)大算力支(zhī)持。在关注各类大(dà)模(mó)型的发(fā)展同(tóng)时,更应该关注算力网络的建设(shè)。

算力网络正驱(qū)动AI产业发(fā)展(zhǎn)进入史诗级加速进程,让AIGC及通用AI这一(yī)人(rén)工智能发展的终极目(mù)标离(lí)得更近。

因为算力可以对突破性技术创新提供大(dà)力的支持。这方面,多模态大模型是典型。作为(wèi)面向未(wèi)来强人工智能、通用(yòng)人工智能的(de)重要技术创新,多模态大模(mó)型已经(jīng)在人工(gōng)智能(néng)领域(yù)提出了很多年,业界也(yě)有不少技(jì)术突破,但是,多模态大模型进一(yī)步(bù)往(wǎng)下走(zǒu),算力需求呈(chéng)几何式上升,一(yī)般(bān)的算力基础设施很快将难以胜任。

从图像、文字、语音单独一项的训练,到双模态、三模态的跃迁,让(ràng)人工智能可以灵活应对不(bù)同模态的转(zhuǎn)化(huà)、像人与世(shì)界(jiè)交互一样(yàng)自然(rán),这方(fāng)面,由算(suàn)力网络来(lái)驱动(dòng)将有明显优(yōu)势(shì)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入(rù)可(kě)控期(qī),将(jiāng)洗(xǐ)牌科技(jì)行业?_黑料正能(néng)量钱塘自古繁华钱塘指的是哪个城市,钱塘指的是哪个城市的别称 data-ratio="0.562962962962963" data-type="jpeg" data-w="1080">

此外,还有很多需要爆发式增长(zhǎng)的算力来支撑的(de)技术创新,将在人(rén)工智(zhì)能算力网络支撑下快速推(tuī)进(jìn)。

AIGC已经露出曙光,期待在大模型和大算力的支持(chí)下AIGC能持续颠覆(fù)内容生产(chǎn)的方式,将创(chuàng)造(zào)的边(biān)际成本降(jiàng)低,让(ràng)万众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 钱塘自古繁华钱塘指的是哪个城市,钱塘指的是哪个城市的别称

评论

5+2=