橘子百科-橘子都知道橘子百科-橘子都知道

田井读什么字,畊和耕的区别

田井读什么字,畊和耕的区别 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人(rén)ChatGPT火爆以来,微软公(gōng)司创(chuàng)始人比尔·盖茨已多(duō)次公开谈论人工智能话题。在最近的一次采访(fǎng)中,他再次表(biǎo)示:“AI可能会让(ràng)科技(jì)行(xíng)业迎来(lái)一(yī)次剧烈的洗(xǐ)牌”。

这个结(jié)论是他在(zài)当地时间(jiān)2月20日(rì)接受《In Good Company》节目专(zhuān)访时提出的。

他预期,AI的发展可能会威胁到谷歌的市(shì)占率(lǜ),因为微(wēi)软在AI方面(miàn)的(de)行动相当迅速(sù)。而最(zuì)终科(kē)技巨头(tóu)将把AI整合成用户(hù)的“全能助手”,包揽一切应用,与人们进行沟通并提供建议(yì),可以取代(dài)亚(yà)马逊(xùn)、Siri或Outlook等应用。

大(dà)佬口中全能助(zhù)手(shǒu)的到来可(kě)能尚需(xū)时日(rì),但由ControlNet引发的又一次AI绘(huì)画浪潮(cháo),让AIGC在ChatGPT的话题热点(diǎn)包围中(zhōng)杀出(chū)重(zhòng)围。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控(kòng)期,将洗(xǐ)牌科(kē)技行业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘(huì)画新(xīn)玩(wán)法

AIGC向可控靠(kào)近

以(yǐ)AI绘画(huà)为代(dài)表的AIGC上(shàng)一次爆火的时候,还是2022年(nián)8月,在美(měi)国科罗拉(lā)多州举办(bàn)的新兴数字艺术家竞赛中(zhōng),一幅名为《太空歌剧院》的作品获奖。

随后各(gè)大(dà)厂商的AI绘画软件被广大网(wǎng)友(yǒu)熟知并(bìng)体验,Stable Diffusion便是其中代表。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能(néng)量(liàng)

用(yòng)户们可(kě)以在应用中(zhōng)输入一组关键词或(huò)者一张照片,就能(néng)获得一幅AI创作的画作。

作画的关键就是所输入的文本。同一组关键词也可以创作出很多张风(fēng)格不一(yī)样的画作,这(zhè)让(ràng)创作(zuò)的过程就像开盲(máng)盒。

很多用户(hù)很喜(xǐ)欢这种不确定的惊喜,他们会将生(shēng)成(chéng)的美图当做头像(xiàng)。而另一部分喜欢翻看AI绘画的“翻车”作品。在(zài)社(shè)交媒(méi)体(tǐ)上,许多用(yòng)户分享AI“翻(fān)车现场”,例如(rú),一位网友的小(xiǎo)狗(gǒu)照片被AI画成(chéng)了“肌肉(ròu)男”,还有网(wǎng)友的个人照(zhào)片被AI识别成了建筑。

而(ér)如(rú)今随着ControlNet的出现与加持,以(yǐ)往AI绘画的填写关键(jiàn)词游戏(xì)可能(néng)要被颠(diān)覆了。

ChatGPT之后又一应(yīng)用杀(shā)疯了(le),AIGC或进入可(kě)控期,将洗牌科技行业?_黑(hēi)料正能量

ControlNet是一位正在斯坦(tǎn)福读博(bó)的(de)中国(guó)人张吕(lǚ)敏创(chuàng)作(zuò)的一种基于控制(zhì)点的图像变(biàn)形算法,主要用于数字图像处理(lǐ)、计算(suàn)机(jī)视觉和计算机图形学等领域。

其SD插件(jiàn)一经发布,在(zài)短短的两(liǎng)天内便成(chéng)为了AI绘画领域最新的热(rè)点。

在此之(zhī)前(qián),大(dà)家用了(le)很多(duō)方法想让AI生成的结果尽可能的符(fú)合要求,但是都不尽如人意(yì),它的(de)出现代(dài)表着AI生成(chéng)开(kāi)始进入真正的可控时期(qī)。

因(yīn)为ControlNet可以直接提(tí)取画面(miàn)的(de)构图,人(rén)物的姿势和画面的(de)深度信息(xī)等(děng)。有了(le)它的帮(bāng)助(zhù),就不用频繁的用提示词(cí)来碰运(yùn)气,抽盲盒(hé)式的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画加了“魔法(fǎ)”,不少博主的(de)作品已(yǐ)经获得了大(dà)量的(de)浏览量,“viggo”就是(shì)其中之(zhī)一,他用朋友的照片直(zhí)接带她们走进动漫世界。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应(yīng)的关键词;最后(hòu)用(yòng)ControlNet插(chā)件绑定骨骼开始(shǐ)换关(guān)键词试效果(guǒ)。

ChatGPT之(zhī)后又(yòu)一应(yīng)用杀疯了,AIGC或(huò)进入可控(kòng)期(qī),将洗牌科技(jì)行(xíng)业?_黑料正能量

通过(guò)图片就可以看(kàn)出来,效果十分惊(jīng)艳。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技行业?_黑料正能(néng)量

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

更厉害(hài)的是,除了真(zhēn)实的照片,草图也可以(yǐ)加上“魔法(fǎ)”,知乎大牛“DevPoint”和(hé)“逗(dòu)砂”介绍到ControlNet还能实现线稿转全彩图。大(dà)神张吕敏其本尊也亲自回应。

ChatGPT之(zhī)后又一应(yīng)用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

不得(dé)不说当下AIGC已经变得(dé)越来越强大,甚至输出的作品都已经能以(yǐ)假乱(luàn)真了。

02

难辨(biàn)虚(xū)实,AIGC技术力爆发

警惕(tì)安全问题

近日,“苏(sū)州金鸡湖有游艇party”的消息火(huǒ)遍网络,而经(jīng)过警方辟谣这(zhè)所谓的“party”可能是全(quán)国第一起AI绘(huì)图(tú)诈骗。

由于这个活动里面给出(chū)的美女照片都是(shì)AI制(zhì)作的真人照(zhào)片(piàn)绘(huì)图(tú),因为(wèi)太(tài)逼真,被大家当成真事传播了(le)

ChatGPT之(zhī)后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌(pái)科(kē)技行(xíng)业?_黑料正能(néng)量

不(bù)过仔细观察可以发现,活动(dòng)发起者提供的照片中(zhōng)有(yǒu)个很(hěn)大的漏洞可(kě)以发现并非真人,而(ér)是AI绘图,那便是图(tú)片中女性(xìng)的(de)手(shǒu)指部分有(yǒu)的(de)存(cún)在异(yì)常。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进(jìn)入可(kě)控期,将洗(xǐ)牌科技行业?_黑料正能量

有行业(yè)人事表(biǎo)示:“现在因为手指部分的绘画算法比较(jiào)复(fù)杂,AI还田井读什么字,畊和耕的区别不太会画人(rén)的(de)手(shǒu),但最新看到的图片已经有越来(lái)越完美的AI模型(xíng)出现,以后可能就完全(quán)没(méi)有漏洞了(le)。

类(lèi)似(shì)的AI作图诈骗在国(guó)外也已有发生。据(jù)英国广播公司(sī)报(bào)道,土耳其地震(zhèn)期间,有Tiktok用户使用AI合(hé)成了儿童受(shòu)灾的假照片发布到网(wǎng)络,以此诱骗善良(liáng)的(de)人打(dǎ)赏“捐助”从而(ér)实(shí)施诈骗(piàn)。

目前随(suí)着技术发展(zhǎn),AIGC已经能做出真人照片般的绘图(tú)效果(guǒ),如果这样的(de)图片被用来诈骗,将非常(cháng)可怕(pà)。

此外AIGC还引发了很多担忧,一方(fāng)面,批判者(zhě)认为AI在“学习”了大(dà)量前人(rén)的作品之后,其创(chuàng)作没(méi)有任(rèn)何情(qíng)绪和灵魂,难以和(hé)人类的(de)艺术创作相提(tí)并论。

另(lìng)一方面(miàn),AIGC背后的版权(quán)、目前都并没(méi)有得到有效的解(jiě)决,还有(yǒu)AIGC会(huì)不会代替人类(lèi)“至高无上”的创意。

马斯克也强调,人工智(zhì)能的安全问题(tí)需要得到重视(shì),太晚就来不(bù)及了。

03

AIGC下一站除了(le)视频,还有(yǒu)远方

技术都是有两面性的,潜在的危害并(bìng)不能掩盖(gài)其(qí)光辉的(de)贡献(xiàn)。现在看来,人工智能技术将田井读什么字,畊和耕的区别是第(dì)四次工业(yè)革(gé)命(mìng)的核心驱(qū)动(dòng)力量(liàng),将创造新的增长奇迹。

过去一年(nián),人工智能在技术和商业层面都(dōu)有了(le)巨大进展,AI绘画(huà)就是人(rén)工智(zhì)能(néng)技(jì)术发生方向性改变(biàn)的一(yī)个代(dài)表。其下一站或许就是视频(pín)。

此前,Meta和(hé)谷歌先后发布了几条引(yǐn)爆科(kē)技圈的短视频。这些视频引发关注并非内容做(zuò)得多优秀(xiù),反(fǎn)而都非常简单,比如一匹(pǐ)正在(zài)喝水的马,一只画(huà)画(huà)的玩(wán)具熊,或(huò)者一段骑摩托车(chē)的第一(yī)视角录(lù)像,随(suí)便一个有手机(jī)的(de)人都(dōu)可以随手录下一段(duàn)。

ChatGPT之后又(yòu)一(yī)应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技行业(yè)?_黑料正能量(liàng)

但这些短(duǎn)视(shì)频的(de)创作方式非常(cháng)简单,创(chuàng)作(zuò)者(zhě)仅(jǐn)仅需要向(xiàng)AI输入一段话,甚至只是说一(yī)下(xià)要求,AI就(jiù)可以(yǐ)根据需要(yào)生成一段视(shì)频。

谷歌发布的(de)两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要突(tū)出(chū)的是高清,与Meta的Make-A-Video没有太多(duō)的差别(bié)。

在Make-A-Video公布了AI生成的视频后,AI圈(quān)就(jiù)已经(jīng)玩了一波(bō)梗(gěng),一个能够做(zuò)出更高清视频的AI还(hái)不(bù)足(zú)以在短时间(jiān)内戳(chuō)中兴(xīng)奋(fèn)点。

Phenaki更加令人震惊(jīng)的地方在(zài)于,它可以制作出(chū)超过(guò)2分钟的连贯的(de)也有(yǒu)确(què)切内容的(de)视频(pín),这才是(shì)真正让人(rén)们感到惊喜的地方。因(yīn)为无论AI生成的(de)视(shì)频多么高清(qīng),也只能是为内容生产者提(tí)供一个灵感,一个素材,一个过场动画。

不过能够制作出有具(jù)体剧情内容的(de)视(shì)频就意味着,一(yī)些视频创作由AI代替人工完成已经初步有了可能。

当下AI的发展速度(dù)已经超过大部分人的想象。内(nèi)容(róng)产业的本质是供给(gěi)创造需求,AIGC作为全新的内容生产方式,可以为(wèi)内容产业带来更新的内容风格、更快的生产速度,更低(dī)的生(shēng)产成本,这(zhè)无疑会驱(qū)动内容产业(yè)的大爆发。

除了AI绘(huì)图(tú)、视(shì)频(pín),AIGC技术(shù)还能应用于音乐、代码、机器人动作(zuò)等(děng)多种内(nèi)容形(xíng)式的生成。不难发现该项技术不仅在游戏(xì)等行业能得到有效应用,对于下一代(dài)互联网(wǎng)各(gè)种元(yuán)素的(de)构建(jiàn)亦(yì)有关键意(yì)义(yì)。

从商(shāng)业化的角(jiǎo)度来看,文化(huà)娱(yú)乐、教育、传媒等诸多(duō)领域,本身就(jiù)对(duì)基(jī)于AI的(de)可视化内容有强烈需求。

因此,AI绘画(huà)及视(shì)频或不是结(jié)果,而(ér)只是AI进程中(zhōng)的一块(kuài)重要(yào)拼(pīn)图,有(yǒu)望在(zài)技术更新(xīn)的加持下(xià)实现更大的(de)应(yīng)用价值。

AI从理解内容,走(zǒu)向了可以生成内容,甚至能够创造出独立价值和(hé)独立视(shì)角的(de)内容。AIGC的再次(cì)出圈(quān),更代表着未来的先进生产力即将(jiāng)到来。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑料正能(néng)量

04

紧(jǐn)抓大模型与算力,牢(láo)固(gù)AIGC底座

从技术的发(fā)展也可(kě)以(yǐ)看出,在语言(yán)大模(mó)型、图像大模型之(zhī)后,多模(mó)态大模(mó)型已经成(chéng)为了(le)新的趋势(shì)。

大模型被誉(yù)为当(dāng)前人工(gōng)智(zhì)能发(fā)展的智能底座,是全球竞争最激烈(liè)的研究方向之一,包括谷歌(gē)、亚马逊(xùn)、百(bǎi)度、阿里、腾讯等众多头部企业都在(zài)竞相(xiāng)发力。

不过训(xùn)练大模型的确价格不(bù)菲(fēi),以国盛证券(quàn)发布(bù)的《ChatGPT需(xū)要多少算(suàn)力》报告估算(suàn),GPT-3训(xùn)练一次的成本约为140万(wàn)美元。而对于一(yī)些更大的LLM(大(dà)型语(yǔ)言模型(xíng)),训练成(chéng)本(běn)则介(jiè)于200万美(měi)元至(zhì)1200万美(měi)元高价之间。

以ChatGPT在2023年1月(yuè)的独立访客平均数(shù)1300万计算,其对(duì)应芯片(piàn)需求为3万多(duō)片英(yīng)伟达A100 GPU,初始投(tóu)入成本约为8亿美元(yuán),每日(rì)仅电费(fèi)就在5万(wàn)美元左右。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能(néng)量(liàng)

此外(wài)不论(lùn)是ChatGPT还是AIGC,都离不(bù)开庞大算力支持。在(zài)关注各类大模型的发展同时(shí),更应该关注算力网络的建设(shè)。

算力网络正驱动AI产业发展进入史诗级加速(sù)进程,让AIGC及通用AI这一人工(gōng)智能发展的终极目标离得更近。

因为算力可以对突破性技术创(chuàng)新提供大力的支持。这方面,多模态(tài)大模型是典型(xíng)。作为面(miàn)向(xiàng)未来强人工(gōng)智能、通用人工(gōng)智能的重要技术创新,多模态大模型已(yǐ)经在(zài)人工智(zhì)能领域提出(chū)了很多年,业界也有不少(shǎo)技(jì)术突(tū)破,但是,多模(mó)态大模型(xíng)进一步往下(xià)走,算(suàn)力需求呈几何式上(shàng)升,一般(bān)的(de)算力基础设施很快将难以胜(shèng)任。

从图像、文字、语音单独(dú)一项的训练,到(dào)双模态、三模态的(de)跃迁,让人(rén)工智(zhì)能可(kě)以灵活应对不同模态的转化、像(xiàng)人与世界交(jiāo)互一样自然(rán),这方面,由算(suàn)力网(wǎng)络来(lái)驱动将有明(míng)显优势(shì)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

此(cǐ)外,还(hái)有很多(duō)需要(yào)爆发式增(zēng)长的算力来支(zhī)撑(chēng)的技术创新,将在人工智能(néng)算力网络支撑下快速推进。

AIGC已经露出曙光,期待在大(dà)模型和大算力的支(zhī)持(chí)下AIGC能持续(xù)颠覆内容生(shēng)产的方(fāng)式,将创造的(de)边际(jì)成(chéng)本降(jiàng)低,让万众受(shòu)益(yì)。

未经允许不得转载:橘子百科-橘子都知道 田井读什么字,畊和耕的区别

评论

5+2=