2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
提示一如既往地重要,但提示工程(乱用令牌)的重要性将下降。
新鲜AI产品点击了解:https://top.aibase.com/
AI设计师Tatiana Tsiguleva提到,V6版本对提示词的理解更加精准,不再需要奇怪的短语或单词。此外,她补充说,Midjourney中的“--s”参数可以调整艺术风格,较低的值会产生更接近提示的结果,而较高的值则会增强艺术创造力。
1、清华、浙大等中国顶尖学府提供了性能优异的GPT-4V开源替代方案。