2024年1月(Sora发布之前)
(本报告部分内容由AI生成,如有错误,告知修改);;
技术与演进;;
已实现的创新
自然语言处理(NLP)的进步
ChatGPT在理解和生成自然语言方面表现出色,展示了先进的自然语言理解和生成能力。
上下文感知对话管理
能够在一定程度上理解和记忆对话历史,实现上下文顺畅的交流。
跨领域知识应用
集成了广泛的领域知识,可以在多种主题上进行交流和生成信息。
用户意图识别与适应性回应
具备识别用户意图并据此调整回答的能力,能够根据不同的查询提供相应的信息和服务。
多模态交互能力
集成并理解多种类型的数据(如文本、图像、声音)进行综合交互。;
上下文的逻辑关联能力
AI幻觉AI想象扩展了异感世界的构建能力
学科能力的全维、全知、全量;
11月16日:苏茨克维通知奥特曼开会。
11月17日:奥特曼、布罗克曼和OpenAI高级研究员相继离职。
11月18日:投资者愤怒并要求奥特曼回归,董事会初步同意。
11月19日:奥特曼等加入微软,近750名OpenAI员工威胁集体辞职,要求奥特曼回归。
11月20日:奥特曼、布罗克曼与OpenAI董事会谈判,微软对奥特曼的回归持开放态度。
11月21日:奥特曼与临时首席执行官进行谈判,公司希望在感恩节前解决领导层问题。内部冲突细节曝光。
结局:奥特曼达成原则上协议,将重返OpenAI担任CEO,并组建新的董事会。;
文生视频技术对场景、动作和情感等的深度理解和创造发展迅速,但仍难以生成完备(如任意时长)且可控(如任意动作)的视频,无法满足用户需求。;
u用户:我昨天晚上去了一个音乐会,主要是为了看我最喜欢的乐队,但是开场乐队也非常棒。
uAI:听起来你过得很愉快。你最喜欢的乐队演奏了哪首歌
曲给你留下了深刻印象?
u用户:他们演奏了《深夜》,那是他们最新的单曲,非常激动人心。不过,我也很惊讶于开场乐队的表现。
uAI:是啊,《深夜》是一首很有力量的歌曲。关于开场乐队,你最喜欢他们的哪个部分?;
世界模型可能带来?
u提升自主学习能力:不再依赖于大量的手工标注数据,而是通过观察世界如何运作来自主学习,这会极大地提高机器学习系统的效率和适应性。
u提升认知能力:随着机器对复杂环境和抽象概念理解的加深,世界模型可以推动AI在需要高级认知能力的领域的应用,如法律分析、财务规划等。
u提升决策和预测能力:世界模型可以在动态和不确定的环境中更好地预测未来的事件和结果,对于自动驾驶车辆的路径规划、金融市场分析等领域有重要意义。;
属性;;
关键技术;;
模态进化:具身智能实体连接;
文本图像
视频音频;
提示词补充规律:
u精确与具体:尽可能准确地解释用户的提示语
u补充和解释:若提示语不够具体或含糊会自行补充细节
u风格和类型:根据指定的艺术风格或类型绘图
u准则和限制:避免生成侵权或不恰当内容
u创意和想象:尽力展现用户超现实的想象
u多样性和包容性:避免人物图像出现偏见和刻板印象;
趋势二:
扩展人类想象力,打造异感世界
AI绘画正在引领一场视觉表现的革命,在用户的指引下延伸至抽象和想象的领域,创造出前所未有的异感世界。在细节再现与艺术表达之间寻求平衡的同时,为人类带来全新的感官体验、情感共鸣和思想启发,为未来的视觉艺术带来无限可能。;;
AI绘画具备前所未有的独特性,其创造力和个性化将为人类带来更多样化的创作体验和艺术作品;
所想所绘:名人书房时代印记;
绘画变种:狮形各异演化之美;
绘画变种:狮形各异演化之美;
重绘差异内在原因;;
创新性偏离:
u创建图像描述时,为了展示技术的多样性和包容性,ChatGPT在描述中加入了不同种族和文化的元素。
u此举旨在展示技术的创新性,但没有完全遵循历史事实,可能会导致历史不准确。
u该现象可称为“创新性偏离”,描述了在追求技术或艺术创新时,有时可能会偏离事实或现实的情况。