商务服务
20秒生成一张画!90后小哥辍学研发AI艺术,火爆全球前曾被200多家风投拒绝?
2024-08-18 14:36

wuhu专题


AI做梦的时候会不会梦见电子羊?



如果你真的这样问


那它还真能给出答案


这款名为“Dream(梦)”的软件中


用户直接输入关键词


20秒即可生成一幅画!


而且你还有十几种风格可以选择!



来看看全球网友们是怎么玩的!


《诅咒之城》,关键词:地狱、肠子、火、尸体、城市、城堡、教堂

关键词:草莓螺旋

关键词:撒旦的梦中房屋、佛兰芒巴洛克

关键词:秋天的新英格兰

关键词:T welldell PEEK 迷幻面孔

关键词:最后的教堂

关键词:梵高《星月夜》

关键词:最终幻想14战士

关键词:怪物和人

关键词:Xanathar

关键词:绯红女巫的火焰

关键词:混沌黄金天使

关键词:宇宙空间,龙

关键词:复仇者联盟


只要你有脑洞


马上就可以输出成画作!


十几种风格信手拈来


而你只需要稍等20秒!


这是多少美术人梦寐以求的操作?



那么这到底是啥黑科技软件?


在哪儿可以玩?


别急!wuhu这就告诉你!


Dream 是一款由加拿大初创公司 Wombo 于去年 11 月发布的应用。



截至去年年底,「Wombo Dream」用户已经生成了超过1000万张图片,在普通用户和艺术家群体中都获得了不错的口碑!


我们来沉浸式体验一下!


首先选择系统自带提示词:永生花


点击黑暗幻想风格


期间我们可以全程观看AI创作的过程


每一步的细化和调整是不是很神奇?



那么接下来我们玩点不一样的!


我们集齐了编辑部所有的脑洞


让大家随机说出N个关键词


看看最后能生成什么样的作品!



有了这款应用


你还可以实现任意混搭!


比如迷幻风格的《蒙娜丽莎的微笑》!



比如蒸汽朋克版《呐喊》!



大家还有什么脑洞?


可以在文末处获取网页链接哦~


这款黑科技为啥这么厉害?


它是如何实现自动生成的?


幕后团队又是谁?


接下来wuhu就带大家来揭晓它的幕后吧~


?

AI生成艺术原理

?


这种由人工智能生成的艺术品并不新鲜,Dream的工程师 Salman Shahid曾在采访中介绍:Dream 算法基于 CLIP 引导。


为了生成相应艺术作品,Dream 模型从一个随机生成的向量开始。向量中的每个条目对应于图像的一个微小细节。有些可能对应于颜色,有些对应于形状,有些对应于更抽象的含义。


通常,随机向量首先对应于一个灰色的像素块。然后,该算法使用 CLIP 来确定当前矢量图像与用户关键词的对应程度,并在多次迭代中改进对应关系。也就是说该应用程序会在最终产品出现之前创建多个图像,而这个过程的随机性意味着 Dream 永远不会两次制作相同的艺术品。


?

抽象?局限?

?


啊这!


难道画师们都要失业了么?!



别急!


AI作画终究是有其局限性的


一位推特用户使用马里奥中的经典角色制作了图片,我们在图中可以看到四位角色的代表色——红色、绿色、黄色和紫色。看上去每个角色都有一个类似帽子的部分,但仔细看却没有一个真正类似于脸的地方。

?


下面是一张关键词为“林克的觉醒”的图片。根据你所认为的脸部的位置,你可以看到他标志性的绿色外衣或者林克在“旷野之息”中穿的蓝色衣服。



由此可见,AI 生成的插图虽然抓住了关键词,但通常看起来很抽象,尤其对角色的细化还有待加强。而且它并不能像真正的人类一样,给用户一个经过思考的答案。


不过很多人似乎很喜欢它们的模糊性,因为某种角度上这会让画面更具“艺术效果”和想象空间。


图源自deviantart用户Dartasia


比如这位画师先在Dream上得到了一张“动漫角色浮在空中”的图片,然后在其上进行再创作,于是得到了左侧这张图。

?

?

3D动画梦境?

?


最近,Dream团队正在扩展更多的语言支持,目前已经可以支持中文、日语、印地语、印度尼西亚语等多种语言。除此之外,Dream还在筹备社交功能的上线,例如用户可以查看、点赞、分享自己或者其他用户的“梦境”。


最令人期待的可能就是团队正在实验的3D动画梦境以及输入图片关键词功能。他们希望用户可以穿越到他们在虚拟现实中创造的梦境中。工程师Shahid对此感到非常激动:“希望随着AI艺术的出现,艺术家可以创造出更酷的东西!”


?

幕后团队

?


神仙软件的背后是怎样一批人?


也许你早就和他们熟悉了


如果你热衷于tiktok等软件的使用


那一定会知道前些日子掀起的对口型唱歌热潮



没错!这款功能的开发商就是Wombo


但你或许不知道的是


Wombo在爆火之前曾被拒绝200多次!

?

2020年4月份,由于疫情爆发,人们待在家里急需更多样的娱乐方式,当时还在上学的Ben-Zion Benkhin抓住灵感、很快构思出了对口型唱歌的想法,然后毅然辍学投入创业。



曾有人提醒他辍学创业的风险,但Benkhin回答道:“时间不等人,如果我不做,马上就会有其他人做。”


就这样Benkhin信心满满地投入了4万加元的积蓄,然而这对于项目开发需要的资金来说还是远远不够的,于是他开始向各位投资者们寻求合作。


但结果是Benkhin创业路上的第一重打击来得尖锐又沉重——他被200多家风险投资商拒绝了。


年纪轻轻、没有任何开发经验、全凭一支大学生团队的他在投资者眼中完全不合格,可Benkhin没有放弃。


也许是功夫不负有心人,Launch House创始人之一的Jacob Peters在一次推介会上被Benkhin的想法惊艳,于是短短一个月后Benkhin就带领团队其他11位创始人一起搬进了Launch House。


不到一年后,Wombo正式上线并迅速火爆全网,第一周下载量50万,第二周900万,第三周则达到惊人的1000多万。


口碑和下载量的直升让这个年轻人迅速进入了资本世界的眼中,此时处境直接反转,大量投资公司通过各种渠道找上门来。


一个多月后,Wombo就在种子轮融资中筹集了600万美金的资金。截至今年年初,依靠 WOMBO 和 WOMBO Dream两款应用,Wombo拥有超过 1000 万的月活跃用户,其中更是囊括了从 Z 世代的青少年到 90 多岁的创作者。


?

? 版权

?


Wombo的工作原理是使用预定义的编排来变形面孔。团队为每首配乐拍摄了基本视频,然后使用将这些预设好的面部动作映射到用户图像上。但这里的重点不是原理,而是配乐。

?

虽然目前音乐的版权所有者并没有提出质疑,但Wombo中一些经典的曲目,比如从 Rick Astley 的 “Never Gonna Give You Up ”到“Numa Numa”很明显受到版权保护。


Benkhin回应道团队仍在处理版权问题,但已经和几位艺术家达成协议。他提到希望Wombo能为他们提供一种与观众互动的全新方式——以一种病毒式传播的、有趣的方式。


受到版权因素影响的并不只有Wombo,事实上Dream因为版权导致的问题更加复杂。


首先有用户质疑平台是否保留了用户作品的版权,因为AI作品转化成的NFT 艺术品无疑是个巨额资金获取来源。

?

比如去年三月,全球超过 2000 万访客围观了一场由佳士得举办的线上数字艺术品竞拍。而拍卖品《Everydays:The First 5000 Days》最终以近 7000 万美元成交落锤,高出了莫奈《睡莲》约 1600 万美元。

?

《Everydays:The First 5000 Days》和作者Beeple


目前Wombo对于Dream产生的版权争议并没有清晰的说明,就法律领域而言这也是一个未定义的问题。不过团队想要进军NFT的第一难关可能还是来自美国版权局,因为他们认为AI作品并不符合版权保护条件,人类身份才是先决要求。


?

? 结语

?


虽然有明显的局限性,但Wombo向我们展示了AI艺术的可能性。也许在未来,游戏、动画、漫画、电影等多个领域都可以应用上类似的技术,我们的任何一个突发奇想都能够迅速落地并且产生价值。尽管距离那样的愿景还有很长的路要走,但又或许先驱者会比你想象的更快出现。


目前市面上已经出现了更多文字生成图片的“神奇AI工具”,比如由艺术家兼程序开发员 @Somnai_dreams 制作的Disco Diffusion。它目前是 GitHub上?的一个开源项目,拥有非常强大的图像转换能力。相比Dream,可自设置的参数更多,也可以实现更复杂的关键词以及风格化表达。但缺点是成图时间长,并且由于目前只以代码形式呈现,所以操作起来比较复杂。



类似的AI绘画工具还有NightCafe Creator,用户可以通过上传图片或文字描述,来生成风格化作品。不过每次创作都需要支付积分,用户可以通过完成分享、发布、资料填写等任务或者直接购买获取。



去年由OpenAI推出的DALL·E已经于几个月前完成了更新迭代,新一代的DALL·E2可以实现更高分辨率、更快地转化图像,并且允许对图像进行编辑。



左:原图?右:DALL·E2编辑后


随着科技的发展,也许艺术行业也将日新月异。总之,在激烈的竞争和口碑维护面前,Wombo还需要更加重视他们的每一项决策。毕竟在如今的社交媒体时代,一款APP可能一夜火爆全网,也可能只是昙花一现。



—END—

    以上就是本篇文章【20秒生成一张画!90后小哥辍学研发AI艺术,火爆全球前曾被200多家风投拒绝?】的全部内容了,欢迎阅览 ! 文章地址:http://3jjewl.riyuangf.com/news/2714.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅易网资讯移动站 http://oml01z.riyuangf.com/ , 查看更多   
最新新闻
中金亦庄产业园10.26亿封闭式基础设施公募REITs更新至“已受理”
可申请提取本人及其配偶住房公积金的情况具体包括:购买、建造、翻建、大修自住住房的;偿还购房贷款本息的;租房自住的;既有住
“鬼畜视频”著作权权利冲突问题初探
【摘要】 鬼畜视频是一种新颖的视频作品表现形式,其制作素材来源广泛,可将动漫动画、影视剧,甚至新闻素材等作为鬼畜视频的创
卖疯啦!上半年畅销的新能源车盘点,买车记得看看,几万元就可以
当下汽车市场,新能源车的推新速度有目共睹,远远比燃油车快,基本上每个月不少于十款新车型进入市场,当中不乏一些热度和话题度
天坛奖国际评委会成员公布 巩俐领衔国内外影人
1905电影网讯 第十一届北京国际电影节将于2021年8月14日至8月21日在北京举办,作为本届北影节重头戏的天坛奖,不仅入围影片各有
白山市地图,卫星地图、实景全图
这是白山地图网页,提供中国吉林省白山市卫星地图高清版,包括可以看到城市、村庄、房子和真实地貌景观的白山市3D实景地图全图,
最新大片
大洋深处,一艘俄罗斯潜水艇正在执行常规任务,但是突发意外导致潜艇爆炸,全体机组人员无一幸免。而这个谜一样的事故,还隐藏着
钱信伊:国际留学生 第一季 Ronny Chieng: International Student Season 1(2017)
自从老友记中的钱德勒以来,又一个我觉得十分好笑的国际友人钱钱。(只是因为翻译都姓钱,所以放在一起不当类比) 相信来看这部
10张地形图,快速了解湖南省湘西州的8个州辖县市
全县总面积约1566平方公里,常住总人口约29.21万。泸溪县是地势西高东低的山区县,山地面积约占总面积的比例为66.04%,丘陵面积
河北省邯郸市行政区划
  邯郸市位于河北省南部,邻接晋、鲁、豫三省,北距省会石家庄150公里,离首都北京450公里。西依太行山,东跨华北平原。  邯
国服萌新入坑国际服攻略《游戏王:决斗链接》
?? 众所周知,《游戏王:决斗链接》自上线国服以来就争议不断,本人作为国际服玩家有幸在开服时候玩过一段时间的国服,算是小有
本企业新闻