AI应用实战

AI可以生成文本、语音、图像、视频等一系列内容。
目前,主流的AI集合网站有阿里的魔搭和国外的huggingface。以及,一些AIGC网址导航。
近期AI的热点内容,包括Openai的sora视频合成框架,以及以D-ID为首的数字人和发音人。
现在你可以用腾讯的闪剪免费使用数字人。更可以通过付费自定义数字人。
而发音人,可以用抖音旗下的豆包免费自定义合成。(只需录一段话)。
AI音乐,可以用网易的天音一键生成,也可以用stable audio合成。
诸如配音,除了都应的数字人配音外,还可以用微软的TTS引擎免费合成。
AI游戏,一般AIGC出来的都是源代码,比如可以用chatgpt或文心一言生成游戏源代码。
一般是python或html5及js、css的。
AI图片,效果最好的估计还是midjouney,此外,还有stable diffusion。
特别是搭配上civitai的插件,绝对事半功倍。
现在,各家都在做自己的AI框架。
比如亚马逊的bedrock,谷歌的gemini,openai的chatgpt及sora,微软的copilot。
国内也是进行地如火如荼,比如抖音的豆包,商汤的天工,清华的智谱清言,百度的文心一言等。
基本上都有类似gpts或gpt商店的功能,其内部,一般称呼为“智能体”。
给你的智能体起个名字,选一个数字人或发音人(有些也可以自定义),然后给他一段介绍。这样,你的智能体就做好了。
传统的绘制视频工具,如openai的dalle以及stable diffusion的txt2mov,一般只能几秒,至多十几秒。
而自openai的sora开始,AI视频跨入了分钟计算的时代。
有人说,sora可能是能够理解这个世界的视频生成智能体。

Tags:,

Add a Comment