每走一步就会深深的撞一下，抱着走一下就撞一下-橘子百科-橘子都知道

每走一步就会深深的撞一下，抱着走一下就撞一下 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天(tiān)机器人ChatGPT火(huǒ)爆以(yǐ)来(lái)，微软公司创始(shǐ)人比尔·盖茨已多次公开(kāi)谈论人工智能(néng)话题。在最近(jìn)的(de)一次采访中，他(tā)再次(cì)表示：“AI可能会让科技行业迎来一次剧(jù)烈的洗牌”。

这个结论是他在当地时间(jiān)2月(yuè)20日(rì)接(jiē)受《In Good Company》节目专访时提(tí)出的。

他预期，AI的发展可能会威胁到谷(gǔ)歌的市占率，因为微软在AI方面的行动相当迅速(sù)。而最(zuì)终科技巨头将把AI整合成用(yòng)户(hù)的“全能助手”，包揽(lǎn)一切应用，与人们进行沟通并提供建(jiàn)议，可以取代(dài)亚(yà)马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可(kě)能尚需时(shí)日，但由ControlNet引发的又一次(cì)AI绘(huì)画浪(làng)潮(cháo)，让AIGC在ChatGPT的话(huà)题热(rè)点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了(le)，AIGC或(huò)进入可控期，将洗牌科技行(xíng)业？_黑料正能量(liàng)

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可控靠近(jìn)

以AI绘画为代表的AIGC上一次爆(bào)火的时(shí)候(hòu)，还(hái)是(shì)2022年8月，在美国科罗拉多(duō)州(zhōu)举办的(de)新兴数字艺术家竞赛(sài)中，一幅名(míng)为《太空歌(gē)剧院》的作(zuò)品获奖(jiǎng)。

随后(hòu)各大厂商的(de)AI绘画软件被广大网(wǎng)友(yǒu)熟知并体(tǐ)验，Stable Diffusion便(biàn)是其中代表。

用户们可以在应用中(zhōng)输入一组(zǔ)关键(jiàn)词(cí)或者一(yī)张照(zhào)片，就能获得(dé)一幅AI创作的(de)画作。

作(zuò)画的关键就是所输(shū)入的(de)文本。同(tóng)一组关键词也可以创作出很多张(zhāng)风格不一样的画作，这让(ràng)创作的过程(chéng)就像(xiàng)开盲(máng)盒。

很多用户很喜(xǐ)欢这种不(bù)确定的惊喜，他们会将生成的美图(tú)当(dāng)做头像。而(ér)另一部分喜(xǐ)欢翻看AI绘画的“翻车”作(zuò)品。在社交媒(méi)体上，许(xǔ)多用户分(f每走一步就会深深的撞一下，抱着走一下就撞一下ēn)享(xiǎng)AI“翻车(chē)现(xiàn)场”，例如，一位网友的(de)小狗照片被AI画(huà)成(chéng)了“肌肉男”，还有网友的个人照(zhào)片被AI识别成了(le)建筑(zhù)。

而如今随着ControlNet的出现与加持(chí)，以(yǐ)往AI绘画的填写关键词游戏可(kě)能(néng)要(yào)被颠覆了。

ControlNet是一位正在斯坦福(fú)读博的中国(guó)人张吕敏创作(zuò)的一种基于控制点的图像变形算法，主要用于数字图像处理、计(jì)算机(jī)视觉和(hé)计(jì)算机图形学等(děng)领(lǐng)域。

其SD插件(jiàn)一(yī)经发布，在短短(duǎn)的两天内便(biàn)成为了AI绘(huì)画领域最新的热点。

在此(cǐ)之前，大(dà)家用了很多方法(fǎ)想让(ràng)AI生(shēng)成的结果尽可(kě)能(néng)的(de)符合(hé)要求(qiú)，但(dàn)是都不尽如(rú)人意，它的出现代表着(zhe)AI生成开始进入真正的可控时期(qī)。

因为(wèi)ControlNet可以直接提取画(huà)面的构(gòu)图，人物的姿势和画面的深度信息等(děng)。有了它(tā)的帮助，就不用频繁的用提(tí)示(shì)词来(lái)碰运气，抽盲盒(hé)式的创作(zuò)了。

通俗的说ControlNet相当于(yú)给AI绘画(huà)加了“魔法”，不(bù)少(shǎo)博主的(de)作(zuò)品已经获得了大量的浏览量，“viggo”就是(shì)其(qí)中(zhōng)之一，他用朋(péng)友(yǒu)的照片直接带她(tā)们(men)走进(jìn)动漫世界(jiè)。

viggo先用StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插件拓展找到对应的关键词；最后用ControlNet插件绑定骨骼开始换关键词试效果。

通过图片就(jiù)可(kě)以看(kàn)出来，效(xiào)果十分惊艳(yàn)。

更厉(lì)害的是，除了(le)真实的照片(piàn)，草图(tú)也可以加上(shàng)“魔(mó)法(fǎ)”，知乎(hū)大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还(hái)能实(shí)现线稿转全彩图。大神张吕(lǚ)敏其本尊也亲(qīn)自回应(yīng)。

每走一步就会深深的撞一下，抱着走一下就撞一下ata-type="jpeg" data-w="1174">

不得不(bù)说当下AIGC已经变得(dé)越来(lái)越强(qiáng)大，甚至输出的作品(pǐn)都已经能(néng)以假乱(luàn)真了。

难辨虚实，AIGC技(jì)术力爆发(fā)

警惕安(ān)全问题

近日(rì)，“苏州(zhōu)金鸡湖有游艇party”的消息(xī)火(huǒ)遍(biàn)网络，而经过警方辟(pì)谣(yáo)这所谓(wèi)的(de)“party”可能(néng)是全国(guó)第一起AI绘图诈骗。

由(yóu)于这个(gè)活动里面给出的美(měi)女照片都是AI制作(zuò)的(de)真人照片(piàn)绘(huì)图，因为(wèi)太逼真，被大家当成真事传(chuán)播了(le)。

不(bù)过仔细观察可以(yǐ)发现，活动发(fā)起者提供的照片中有个很(hěn)大的漏(lòu)洞(dòng)可以(yǐ)发(fā)现并非真(zhēn)人，而是AI绘(huì)图，那便是图片中女性的手(shǒu)指部分有的(de)存在异常。

ChatGPT之(zhī)后又一(yī)应用杀疯(fēng)了(le)，AIGC或(huò)进入(rù)可控期，将洗牌科技行业？_黑料正能量

有行业人事表(biǎo)示：“现在(zài)因为手(shǒu)指部分的绘画算法比较复杂，AI还不太(tài)会画人的(de)手(shǒu)，但(dàn)最新看(kàn)到的图(tú)片已经(jīng)有越来越完美的AI模型出现，以后可能就完全没(méi)有漏洞了(le)。”

类似的AI作图(tú)诈骗在国外(wài)也已(yǐ)有发生(shēng)。据英国(guó)广播公司报道，土(tǔ)耳其地(dì)震(zhèn)期(qī)间，有Tiktok用户(hù)使用AI合成了儿童受灾(zāi)的假(jiǎ)照(zhào)片发(fā)布到网络，以此诱骗善良的(de)人(rén)打赏(shǎng)“捐(juān)助”从(cóng)而实施诈骗(piàn)。

目前随着(zhe)技术发展，AIGC已经能做出真人照片(piàn)般的绘图效果，如果这样的图片被用来诈骗，将非常可怕。

此外AIGC还引发了很多担忧，一(yī)方面，批判者认为AI在“学(xué)习”了(le)大量前人的作品之后，其创作没有任何情绪(xù)和灵魂，难以和人类(lèi)的艺(yì)术创作(zuò)相提并论。

另一方面(miàn)，AIGC背后的版权、目前都并(bìng)没有得到(dào)有效的(de)解决，还有AIGC会不(bù)会代替人类“至高无上”的创意。

马斯(sī)克(kè)也强调(diào)，人工智能的安全问题(tí)需要得到(dào)重视，太(tài)晚就来(lái)不及了。

AIGC下一站除了视频，还(hái)有远方(fāng)

技术(shù)都是有两面性的，潜在(zài)的危害并不能掩(yǎn)盖其光辉的贡献。现在看来(lái)，人工智能技术将(jiāng)是第四次工(gōng)业革命(mìng)的核心(xīn)驱(qū)动(dòng)力量，将(jiāng)创造新(xīn)的增(zēng)长(zhǎng)奇迹。

过去一年，人工(gōng)智(zhì)能(néng)在技术和(hé)商业层面(miàn)都有了巨大进(jìn)展，AI绘(huì)画(huà)就(jiù)是人工(gōng)智能技术发生方向性改变的(de)一个代表。其下一(yī)站或许就是视频。

此前，Meta和谷歌(gē)先(xiān)后发(fā)布了几条引爆(bào)科技圈的短视频。这些视频引发关注并非内容做(zuò)得多优(yōu)秀(xiù)，反而都非(fēi)常简单，比如一(yī)匹正在喝水的(de)马，一只(zhǐ)画画(huà)的玩(wán)具熊，或者(zhě)一(yī)段骑摩托(tuō)车的第一视(shì)角录像，随便一个(gè)有手机的人都可以随手(shǒu)录下一段。

但这些短视频的创作(zuò)方式(shì)非常简单，创作者仅仅需要向AI输(shū)入(rù)一段话，甚至(zhì)只(zhǐ)是说(shuō)一(yī)下要求，AI就可以根据需(xū)要生成一段视频。

谷歌(gē)发布的两个AI生成视(shì)频分别来自于Imagen Video和Phenaki，前者主要(yào)突出的是高清，与Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公(gōng)布了AI生成的(de)视频(pín)后，AI圈就已经(jīng)玩了(le)一波(bō)梗，一个能够做出更高清视频(pín)的AI还不足以在短时(shí)间内戳中兴奋点。

Phenaki更(gèng)加令人震惊的地(dì)方在于，它(tā)可(kě)以制作(zuò)出超(chāo)过2分(fēn)钟的连(lián)贯的(de)也(yě)有确切内(nèi)容(róng)的视频，这才是(shì)真正让人们(men)感到惊喜(xǐ)的地方。因为(wèi)无论AI生成(chéng)的视频多么高清，也只能(néng)是(shì)为(wèi)内容生产者提(tí)供一个(gè)灵感，一个素材，一个过场动画。

不过能够制作出有具(jù)体剧情内(nèi)容的(de)视频就意味着，一些视(shì)频(pín)创作由(yóu)AI代(dài)替人工完成已经初步有了可能。

当(dāng)下AI的(de)发(fā)展速度已经超过大部分人的想象。内容产业的本(běn)质(zhì)是供(gōng)给创造需求，AIGC作为(wèi)全新的内容生产(chǎn)方式，可以为内容产业带来更新的内容风格、更(gèng)快的生产速度，更低(dī)的生产(chǎn)成本(běn)，这无疑会驱(qū)动内容产(chǎn)业的大爆发。

除了(le)AI绘图(tú)、视频(pín)，AIGC技(jì)术还能应用于(yú)音乐、代码、机器人动作等多种内容形式的生成(chéng)。不难发现该项技术不仅在(zài)游戏等行业能得到有效应用，对(duì)于下一代(dài)互(hù)联网各种元素的(de)构建亦有关键意义(yì)。

从商业化的(de)角度来(lái)看，文化(huà)娱(yú)乐、教(jiào)育、传媒等诸多领域，本身就对基于AI的(de)可视化内容有强烈需求。

因此，AI绘画及(jí)视频或不是结果，而只是AI进程中(zhōng)的一(yī)块重要拼图，有望在技术更新的加持(chí)下实现更大(dà)的应用价值(zhí)。

AI从理解内容，走向了可以(yǐ)生成内容(róng)，甚至能够(gòu)创造出(chū)独立价值(zhí)和独立视角(jiǎo)的内容(róng)。AIGC的再次出圈，更代表着(zhe)未来的先进生(shēng)产力即将到来。

紧抓大模型与算力，牢固AIGC底座

从技(jì)术的发(fā)展也可以看(kàn)出，在语言大模型(xíng)、图像(xiàng)大模(mó)型之(zhī)后，多模态大模型已经成为了(le)新的(de)趋(qū)势。

大模型(xíng)被誉为当前(qián)人工智(zhì)能发展的智能底座，是全(quán)球竞争最激(jī)烈的研究方向之(zhī)一，包括谷(gǔ)歌、亚马逊、百度、阿里、腾讯等众多头部企业都在竞相发力(lì)。

不(bù)过训(xùn)练大(dà)模型的(de)确价格不(bù)菲(fēi)，以(yǐ)国盛证券发布的(de)《ChatGPT需(xū)要多少算力》报告估算(suàn)，GPT-3训练一(yī)次的成本约为(wèi)140万美元。而(ér)对(duì)于一些更大的LLM(大型语言模型(xíng))，训练(liàn)成本则介于200万美元(yuán)至1200万美元(yuán)高(gāo)价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立访客平均数(shù)1300万计算，其对应芯片需求为(wèi)3万多片英(yīng)伟达(dá)A100 GPU，初始(shǐ)投(tóu)入成本约为8亿(yì)美元，每日仅电费(fèi)就在5万美元左右。

此外不论是(shì)ChatGPT还是AIGC，都离不开庞大算力支持。在(zài)关注各类大模型的发展(zhǎn)同时，更应该(gāi)关注算力网络的建(jiàn)设(shè)。

算(suàn)力网络正(zhèng)驱动(dòng)AI产业(yè)发展进(jìn)入(rù)史诗级加(jiā)速进程，让AIGC及通用AI这一人工智(zhì)能发展(zhǎn)的终(zhōng)极目标(biāo)离得更近。

因为算力可以对突破性技(jì)术创新提供大力(lì)的(de)支持。这方(fāng)面，多模态大模型是典(diǎn)型。作为面向未来强(qiáng)人工智能(néng)、通(tōng)用人(rén)工智能的重(zhòng)要(yào)技术创新(xīn)，多模态大(dà)模(mó)型已经(jīng)在人(rén)工智能领域提出了很多年(nián)，业界(jiè)也有不少(shǎo)技术突破，但(dàn)是，多模态大模型进一步往下(xià)走，算力(lì)需求呈几何式上升，一般的算力基(jī)础(chǔ)设施很快(kuài)将(jiāng)难以胜任。

从图像、文字、语(yǔ)音(yīn)单独一(yī)项的(de)训练，到双模(mó)态、三模态的(de)跃迁，让人工(gōng)智能可(kě)以灵活应对不同(tóng)模态的转化、像人与世(shì)界交互一样(yàng)自(zì)然，这(zhè)方面，由算(suàn)力网络(luò)来驱动将有(yǒu)明(míng)显优势。