2023 年 6 月 – Sonic's blog, since 2003…

MusicGen：AI生成音乐

Meta开源了MusicGen模型，只需要输入简单提示词，就可以生成不同风格的音乐。

怎么玩儿？简而言之就是文字提示生成音乐。单纯的文字生成音乐；给文字提示+上传一段旋律作为参考，生成一段音乐；或者干脆直接用音乐产出音乐。不过测试端只能生成30s的音乐。

我自己也体验了下，操作确实简单，不懂代码和算法的小白也可以去测试地址玩一玩。

号称三步就能生成有虚拟主持人的视频，今天我们也来试用一下这个AI软件HeyGen。

第一步，挑选主持人 可以产品自带的头像，也可以自己上传。

今天我们尝试一下用gamma制作presentation。

gamma提供两种制作方式：

两种方式我们会分别测试。

Google 近期又推出了一项款的图片生成工具-StyleDrop，它能够通过文本到图像的模型生成忠实于某一特定风格的图像。主要特点在于，能够精准捕捉到自定义风格的细微差别，包括配色、光影效果、局部和整体的效果等。甚至仅需一张图片作为参考，就能生成与之风格及其相似的图片。

Google官方给出的一些演示图片的效果十分惊人，左边是原始的风格图片，用户只需要在文本Prompt A letter ” in [V] style中添加相关的物体，StyleDrop就能生成的类似参考图风格的图片，具体可参见项目网站：https://styledrop.github.io

对复杂的艺术风格进行复刻，比如生成梵高风格的图片、某一水彩画风格

对细节之处进行精准捕捉，比如对参考图中纸面褶皱感的还原

木雕风格的英文字母的设计

制作自己的风格的LOGO

不过最重要的是，与其他工具对比，Styledrop的成图效果明显更胜一筹，以下是对比，文字提示为a golden gate bridge、the letter G、a man riding a snowboard

目前还没有给出测试途径，无法亲自尝试，感兴趣的还可以看一下论文，研究学习一下其背后的模型、逻辑和算法流程https://arxiv.org/pdf/2306.00983.pdf