橘子百科-橘子都知道橘子百科-橘子都知道

bushi是什么意思,bushi是什么意思中文翻译

bushi是什么意思,bushi是什么意思中文翻译 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器(qì)人ChatGPT火爆(bào)以(yǐ)来,微软(ruǎn)公司创始人比尔(ěr)·盖(gài)茨已多次(cì)公开谈论人工智能话(huà)题。在最(zuì)近的一次采访中,他(tā)再(zài)次表示:“AI可能会(huì)让科技行业迎来一次剧烈的洗牌”。

这个结论是(shì)他在(zài)当(dāng)地时间2月20日(rì)接受(shòu)《In Good Company》节(jié)目专访时(shí)提(tí)出的(de)。

他(tā)预期,AI的发(fā)展可(kě)能会威胁到谷歌的市占(zhàn)率(lǜ),因为微软在AI方(fāng)面的行动(dòng)相当(dāng)迅速。而最(zuì)终科技(jì)巨头将把AI整合成(chéng)用户的“全能助(zhù)手(shǒu)”,包(bāo)揽一切(qiè)应用(yòng),与人(rén)们进行沟通并提(tí)供建议(yì),可以取代亚马逊(xùn)、Siri或Outlook等(děng)应(yīng)用。

大佬口(kǒu)中全(quán)能助手(shǒu)的到来可能尚需时日,但由ControlNet引发的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点包围(wéi)中杀出重围。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入可控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正(zhèng)能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还(hái)是2022年8月,在美国科罗拉多州举办(bàn)的新兴数字(zì)艺术(shù)家竞(jìng)赛中,一幅名(míng)为《太空歌剧院》的作品获奖(jiǎng)。

随后各(gè)大(dà)厂(chǎng)商的(de)AI绘(huì)画(huà)软件被(bèi)广大网友熟知并体验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技行业?_黑(hēi)料正能量(liàng)

用户们可以在应用中输入一组关键词或者一张照片,就能获(huò)得一幅AI创作的画(huà)作。

作画的关(guān)键就是所输入的文本(běn)。同一组关键词(cí)也可以(yǐ)创作出很多(duō)张风格(gé)不(bù)一样(yàng)的画作,这让(ràng)创(chuàng)作(zuò)的过程就像(xiàng)开盲(máng)盒。

很多用户很喜欢这种(zhǒng)不确定的惊(jīng)喜(xǐ),他们会将生成的美图当做头像(xiàng)。而另一部分喜欢翻看AI绘画的“翻(fān)车”作品。在社交媒(méi)体上,许多用户分享AI“翻(fān)车现场”,例(lì)如,一位网友的小狗照片被AI画成了(le)“肌肉男”,还(hái)有网友的个人照片被AI识别(bié)成了建筑。

而如今随(suí)着(zhe)ControlNet的出现与加持,以(yǐ)往(wǎng)AI绘画的填写关键词游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正(zhèng)能(néng)量

ControlNet是一bushi是什么意思,bushi是什么意思中文翻译位正在斯坦福读博的中国人张吕敏创作(zuò)的(de)一种基于控(kòng)制点(diǎn)的图像变形算法,主要用于(yú)数字图像处理、计(jì)算机视觉和计算(suàn)机图形学等(děng)领域。

其(qí)SD插件一经发布,在短(duǎn)短的两天内便成为了(le)AI绘画领域(yù)最新的热点。

在此之前,大家用了(le)很多方法想让(ràng)AI生成的结果尽可(kě)能(néng)的符合要求,但是(shì)都不尽(jǐn)如人意(yì),它的出现代表着AI生成开始进入真正的(de)可控时期。

因为ControlNet可以直接(jiē)提取画面(miàn)的构(gòu)图,人物的姿势和画面的深度(dù)信息等。有了它(tā)的(de)帮助,就(jiù)不用(yòng)频繁(fán)的用(yòng)提示(shì)词来碰(pèng)运气,抽盲盒式的创作了。

通(tōng)俗的说ControlNet相(xiāng)当于给AI绘(huì)画加了“魔(mó)法”,不少博主的作品已经(jīng)获得(dé)了大量的(de)浏(liú)览量,“viggo”就是其中之(zhī)一(yī),他用朋友的照(zhào)片直(zhí)接(jiē)带她们走进动漫世(shì)界。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量(liàng)

viggo先(xiān)用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词;最后(hòu)用ControlNet插件(jiàn)绑(bǎng)定骨(gǔ)骼开始换关(guān)键词试效果。

ChatGPT之后又一应(yīng)用杀疯(fēng)了(le),AIGC或进入(rù)可(kě)控(kòng)期(qī),将(jiāng)洗牌科技行业?_黑料正能量

通过图(tú)片就可以看出来(lái),效果十分惊艳(yàn)。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科(kē)技行业?_黑(hēi)料(liào)正(zhèng)能量

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正能量

更厉害的是,除了(le)真实(shí)的照片(piàn),草(cǎo)图也可以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全(quán)彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期,将(jiāng)洗牌(pái)科技行(xíng)业?_黑料正能量(liàng)

不(bù)得不说当下AIGC已(yǐ)经变得(dé)越来越强(qiáng)大(dà),甚(shèn)至(zhì)输出的(de)作(zuò)品都已(yǐ)经能以假乱真了。

02

难辨虚(xū)实,AIGC技术力爆发

警(jǐng)惕安全(quán)问(wèn)题(tí)

近日,“苏(sū)州金鸡湖有游艇(tǐng)party”的消息火遍网络,而经过警方辟谣这所谓的“party”可能(néng)是全国第一起AI绘图诈骗。

由于这个活动里面给(gěi)出的美女(nǚ)照片(piàn)都是AI制(zhì)作的真人照片绘图,因为太逼真(zhēn),被大(dà)家当成真事(shì)传(chuán)播了

ChatGPT之(zhī)后(hòu)又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控(kòng)期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

不过仔(zǎi)细观察(chá)可以发现,活动发起者提供的照片中有个很大的(de)漏(lòu)洞(dòng)可以(yǐ)发现(xiàn)并(bìng)非真人,而(ér)是AI绘图,那便(biàn)是图(tú)片中女性的手指(zhǐ)部分(fēn)有的存在异(yì)常。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯(fēng)了,AIGC或进入可控期(qī),将(jiāng)洗牌科(kē)技行业?_黑料正能量

有行业人事表示:“现在因为手指部(bù)分(fēn)的绘画算法(fǎ)比较(jiào)复杂,AI还不太会画人的手,但(dàn)最新看到的图片已经有越来越(yuè)完美的(de)AI模(mó)型出(chū)现,以后(hòu)可能就(jiù)完全(quán)没(méi)有漏洞了。

类似的AI作图诈骗(piàn)在国外也已(yǐ)有发(fā)生。据(jù)英国广播公司报道,土耳(ěr)其地震期间,有Tiktok用户使用(yòng)AI合(hé)成(chéng)了(le)儿童受灾(zāi)的假照片(piàn)发(fā)布到(dào)网络,以此诱(yòu)骗善(shàn)良的人(rén)打赏“捐(juān)助”从而实施诈骗。

目前随着技术发展,AIGC已经能(néng)做出(chū)真人照(zhào)片(piàn)般的绘图效果(guǒ),如果这样的图片被用来(lái)诈骗,将非常可(kě)怕。

此外AIGC还引发了很多(duō)担忧,一方面,批判者认为(wèi)AI在“学习”了大量前人的作品(pǐn)之后(hòu),其(qí)创作没有任何情绪和灵(líng)魂,难(nán)以和人类的艺术创(chuàng)作相提(tí)并(bìng)论。

另一方(fāng)面,AIGC背后的版权、目前都并没有得到有效的解决,还(hái)有AIGC会(huì)不会代(dài)替(tì)人类“至高无(wú)上(shàng)”的(de)创意。

马斯克也强调,人(rén)工智能的安(ān)全问题需要(yào)得到(dào)重视(shì),太晚就来不及了。

03

AIGC下(xià)一站除了视频,还有(yǒu)远方

技术都是(shì)有(yǒu)两面性的,潜在的危害并不能(néng)掩盖其(qí)光辉的贡献(xiàn)。现在看来,人(rén)工(gōng)智(zhì)能技术将是第(dì)四次(cì)工业革命(mìng)的核(hé)心驱动力量,将创造新的增长奇迹。

过去一年,人(rén)工智能(néng)在技术和商业层面都有了巨(jù)大进展,AI绘画(huà)就是(shì)人工智能技术发生方向性改(gǎi)变的一个代表。其下一(yī)站(zhàn)或许就是(shì)视频(pín)。

此前,Meta和谷歌(gē)先后发(fā)布了(le)几条(tiáo)引爆科技圈的短(duǎn)视频。这(zhè)些(xiē)视频(pín)引发关注并非内(nèi)容(róng)做得多优秀,反而都非(fēi)常(cháng)简单,比如一(yī)匹正(zhèng)在喝水的马,一只(zhǐ)画画的玩具熊(xióng),或者一段骑(qí)摩(mó)托(tuō)车的(de)第(dì)一视角(jiǎo)录像,随便一个(gè)有手机的(de)人都可以(yǐ)随手(shǒu)录(lù)下一段。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料正能量

但这些(xiē)短视频的(de)创作(zuò)方(fāng)式非常简单,创作者仅(jǐn)仅需要向(xiàng)AI输入一段话,甚至只是(shì)说一下要求,AI就可以(yǐ)根据(jù)需要生成一(yī)段(duàn)视频。

谷歌发(fā)布的(de)两个AI生成视(shì)频分(fēn)别来自于Imagen Video和Phenaki,前(qián)者主(zhǔ)要突出的是高清,与Meta的Make-A-Video没有太多的差(chà)别。

在(zài)Make-A-Video公(gōng)布了AI生成(chéng)的(de)视(shì)频(pín)后,AI圈就已经玩了一波梗,一个(gè)能够做(zuò)出更高清(qīng)视频的AI还(hái)不足以在短时(shí)间内戳中(zhōng)兴奋点。

Phenaki更加令(lìng)人震(zhèn)惊的地方在(zài)于,它可以制作出超过2分钟的连贯的也(yě)有确切内容的视频,这才是真(zhēn)正让人们感到惊喜的地方。因为无论AI生(shēng)成的视频多(duō)么高(gāo)清,也只能是为内容生产(chǎn)者提(tí)供一个灵感(gǎn),一个(gè)素材,一个(gè)过场动画。

不过(guò)能够制(zhì)作出有具体剧情内(nèi)容(róng)的视频就意味着(zhe),一些视频(pín)创作由AI代替(tì)人工完成已经(jīng)初步有了可能。

当下(xià)AI的发展速度已经超过大部分人的想(xiǎng)象。内(nèi)容产业的本质是供(gōng)给(gěi)创造需求,AIGC作为全新的(de)内容(róng)生产(chǎn)方式(shì),可以为内容产业带(dài)来(lái)更新的(de)内容风格、更(gèng)快的生(shēng)产速度,更(gèng)低的生产(chǎn)成本,这无疑(yí)会驱(qū)动内容产(chǎn)业(yè)的(de)大(dà)爆发(fā)。

除(chú)了(le)AI绘(huì)图、视频,AIGC技术还能应用(yòng)于音乐、代码、机器(qì)人(rén)动作等多种内容(róng)形式的生成。不难发现该项技(jì)术不仅在(zài)游(yóu)戏等(děng)行业能得(dé)到有效应用,对于(yú)下一代互(hù)联网各种元素的构建亦有(yǒu)关键意义。

从商(shāng)业化的角度来看(kàn),文化娱乐(lè)、教育、传(chuán)媒等诸(zhū)多领域,本(běn)身就对基于AI的(de)可(kě)视化(huà)内容有(yǒu)强烈需求。

因此,AI绘(huì)画及(jí)视频(pín)或不(bù)是(shì)结果,而只是AI进程中(zhōng)的一块(kuài)重要拼图,有望在(zài)技术更新的加持下实现更大的应用价值(zhí)。

AI从理解内容,走向了可以生(shēng)成内容,甚至(zhì)能够创造出独立价值和独(dú)立视角的(de)内容。AIGC的再次出(chū)圈(quān),更代表着未来的先(xiān)进生产力即将到(dào)来。

ChatGPT之(zhī)后(hòu)又一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正能量

04

紧抓大模型与算力(lì),牢固(gù)AIGC底(dǐ)座(zuò)

从技(jì)术的(de)发展也可以看出,在语言(yán)大模(mó)型(xíng)、图像大(dà)模型之后,多模态大(dà)模(mó)型已(yǐ)经成为了新的趋势。

大模型被(bèi)誉为当前人工智能发展(zhǎn)的(de)智能底(dǐ)座(zuò),是(shì)全球竞争(zhēng)最激烈的(de)研究方向之一,包括谷歌(gē)、亚马逊、百度、阿里、腾讯等众多(duō)头部企业都在(zài)竞相发力。

不过训练大模(mó)型的确价格(gé)不(bù)菲,以国盛证券发布的《ChatGPT需(xū)要多(duō)少(shǎo)算力》报告(gào)估算(suàn),GPT-3训练(liàn)一次(cì)的成本(běn)约为(wèi)140万美元。而(ér)对于(yú)一些(xiē)更大的LLM(大型(xíng)语言模型),训练成(chéng)本则介(jiè)于(yú)200万美元至1200万美元高价之(zhī)间(jiān)。

以ChatGPT在(zài)2023年1月(yuè)的独(dú)立访(fǎng)客平(píng)均数1300万计算,其对(duì)应(yīng)芯(xīn)片(piàn)需(xū)求为3万多(duō)片英伟达(dá)A100 GPU,初始投入成本约(yuē)为8亿(yì)美(měi)元,每日(rì)仅电(diàn)费就(jiù)在5万美元左(zuǒ)右。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

此(cǐ)外不论是ChatGPT还是AIGC,都离不开庞(páng)大算力(lì)支持。在关注各类大模(mó)型的发(fā)展同时,更应该关(guān)注(zhù)算(suàn)力网(wǎng)络的建设。

算力(lì)网络(luò)正驱动AI产业发展(zhǎn)进入史诗级加速进程(chéng),让AIGC及(jí)通用AI这一人工智能发展的终(zhōng)极目标(biāo)离得更近。

因为算力可(kě)以对突破性技术创新提供(gōng)大力的支(zhī)持。这(zhè)方(fāng)面,多模态大模(mó)型是(shì)典型。作为面向未来强人工智能、通用人工智能(néng)的重要技术创(chuàng)新,多模态大模型已(yǐ)经在人工(gōng)智能领域(yù)提出了很多(duō)年,业界也有不少技术(shù)突(tū)破,但是,多(duō)模态大(dà)模型进(jìn)一步往下走(zǒu),算力需求(qiú)呈几何式上升,一(yī)般(bān)的算力基础设施(shī)很快将难以胜(shèng)任(rèn)。

从(cóng)图像(xiàng)、文(wén)字、语(yǔ)音(yīn)单独一项的训练,到双模态、三模态的(de)跃迁,让人工智(zhì)能可以灵活应对不同模态的转化、像(xiàng)人(rén)与世界交(jiāo)互(hù)一样自然(rán),这方面,由(yóu)算力(lì)网络(luò)来驱动(dòng)将有明显优势。

ChatGPT之(zhī)后又一应用(yòng)杀疯(fēng)了,AIGC或进入(rù)可控期(qī),将洗(xǐ)牌(pái)科技(jì)行业(yè)?_黑(hēi)料正能量

此外,还有很多需要爆(bào)发式增长(zhǎng)的算力来支撑(chēng)的技术创新,将在人工智能算力网络(luò)支撑下(xià)快(kuài)速推进(jìn)。

<bushi是什么意思,bushi是什么意思中文翻译p>AIGC已经露出曙(shǔ)光,期待在大模型和(hé)大算力的支持下(xià)AIGC能(néng)持续(xù)颠覆内容生产(chǎn)的方式,将创造(zào)的边际成本降低,让万众(zhòng)受(shòu)益(yì)。

未经允许不得转载:橘子百科-橘子都知道 bushi是什么意思,bushi是什么意思中文翻译

评论

5+2=