MusicGen:AI生成音乐

Meta开源了MusicGen模型,只需要输入简单提示词,就可以生成不同风格的音乐。

怎么玩儿?简而言之就是文字提示生成音乐。单纯的文字生成音乐;给文字提示+上传一段旋律作为参考,生成一段音乐;或者干脆直接用 音乐产出音乐。不过测试端只能生成30s的音乐。

我自己也体验了下,操作确实简单,不懂代码和算法的小白也可以去测试地址玩一玩。

继续阅读MusicGen:AI生成音乐

StyleDrop 图片风格复刻大师

Google 近期又推出了一项款的图片生成工具-StyleDrop,它能够通过文本到图像的模型生成忠实于某一特定风格的图像。主要特点在于,能够精准捕捉到自定义风格的细微差别,包括配色、光影效果、局部和整体的效果等。甚至仅需一张图片作为参考,就能生成与之风格及其相似的图片。

Google官方给出的一些演示图片的效果十分惊人,左边是原始的风格图片,用户只需要在文本Prompt A letter ” in [V] style中添加相关的物体,StyleDrop就能生成的类似参考图风格的图片,具体可参见项目网站:https://styledrop.github.io

对复杂的艺术风格进行复刻,比如生成梵高风格的图片、某一水彩画风格

对细节之处进行精准捕捉,比如对参考图中纸面褶皱感的还原

木雕风格的英文字母的设计

制作自己的风格的LOGO

不过最重要的是,与其他工具对比,Styledrop的成图效果明显更胜一筹,以下是对比,文字提示为a golden gate bridge、the letter G、a man riding a snowboard

目前还没有给出测试途径,无法亲自尝试,感兴趣的还可以看一下论文,研究学习一下其背后的模型、逻辑和算法流程https://arxiv.org/pdf/2306.00983.pdf