domingo, 5 de mayo de 2024

Creación de texto a música (parte 1)

que tal amigos de Unidos pa sonar, estuve estos días probando inteligencias artificiales que nos permiten hacer canciones con un solo prompt de texto, y he probado 6.

ojo que entre esas 6 también estuvo nuestro querido suno, pero no hablaré de él por el momento.

este artículo será dividido en dos partes, en cada uno hablaré de 3 de las 6 herramientas de creación de musica con AI

en la primera parte mencionaré las menos importantes, y el la segunda parte las que todos usamos, inclusive suno.

compararemos sus pro y sus contra.

en la primera parte de este artículo tenemos a:

riffusion, voice mod text to music, y song R.

son las menos importantes pero vale la pena mencionarlas, pues en algún momento necesitaremos de ellas.

registro

tanto en song r como en voicemod tendrás que registrarte para poder usarlo.

en el caso de voicemod no se permite registrarte con google o facebook, ahí te registras con nombre de usuario y contraseña.

song r por el contrario, para generar canciones no  es necesario registrarte, pero para descargar en audio tus creaciones o compartirlas ahí si tienes que hacerlo.

en riffusion sí puedes hacer igual que suno, escribir el ritmo, el genero y hasta las voces, en cuanto a song r solo puedes escribir la letra o generarla desde ahí mismo, generará canciones bazados solo en 6 géneros musicales, voicemod es muchísimo más limitado, pues generará sobre 8 canciones predefinidas, en el futuro se sumarán más canciones.

Idiomas soportados

por desgracia estas 3 herramientas sólo soportan el idioma inglés, si no sabes inglés entra a chat gpt escribe algo en español y que chat gpt te lo traduzca, luego aquel texto pégalo en cualquiera de las 3 herramientas.

Voces

riffusion tiene una cantidad infinita de voces que va cambiando con cada generación casi igual que suno.

voicemod, cuenta con un pequeño catálogo de 20 voces, que se irán sumando mas en el futuro.

song r por el contrario, sólo tiene 3 voces, una masculina y dos femeninas.

Géneros musicales

riffusion puede soportar cualquier género musical, pero no del todo, pues su inteligencia artificial está entrenada mas en la música americana, es posible crear hip hop, rap, soul, country, funkey, EDM, trap, en generaciones que no estén en estas categorías, por ejemplo algún género latino, siempre falla.

song r, tiene solo 6 géneros musicales, pop, electrónica, hip-hop, rock, cafe, y childrens.

voicemod es muchísimo más limitado pues solo se limita a 8 canciones predefinidas, una de eminem, otra de ariana grande, otra de otro rapero que no recuerdo su nombre, y algunas más incluyendo el cumpleaños feliz.

Calidad de las voces

en los 3 casos, sus voces son bastante buenas y realistas, en voicemod, se oye un tanto sintetizado como si fuese vocaloid.

Calidad de la música

riffusion tiene una calidad súper buena tanto en la música como en la de las voces, song r te genera nuevas melodías pero casi siempre son aburridas, y gran parte de ellas  están en la menor o la mayor.

voicemod, solo toma los estribillos de sus 8 canciones para generar dis que una canción nueva.

y que pasa si escribo en español o  algún otro idioma?.

en riffusion y song r, no ocurriría nada, solo que lo que escribas en español tendrá un fuerte acento americano.

voicemod en cambio cuida de que no se escriban cosas que no sean en perfecto inglés, cuando intentas escribir algo en otro idioma,  el sistema piensa que estas generando contenido prohibido y no genera tu canción, y te advierte que si haces esto 3 veces serás baneado.

Duración de las generaciones

song r, puede generar canciones hasta de 3 minutos si lo deseas, en este aspecto song r le gana incluso a las más importantes!

en riffusion son 14 segundos.

y en voicemod, son 10 segundos, o quizás menos si usas la plantilla del cumpleaños feliz.

en voicemod dentro de sus 8 canciones puedes escribir cuanto quieras, pero generará solo 10 segundos de audio.

sin embargo, si escoges la plantilla de cumpleaños feliz, el texto escrito será mas corto, y tendrás entre 15 a 20 caracteres para escribir, esto es por que la plantilla ya canta el happy birrthday to you, y solo hay espacio para poner el nombre del cumpleañero.

Limitaciones

riffusion y voicemod te permite crear canciones ilimitadas, song r puede generar canciones ilimitadas, pero solo te permite 5 descargas, al acabar las 5 descargas, tendrás que comprar su suscripción.

Mi favorita

obvio que mi favorita es riffusion, por tener una calidad parecida a suno, y por su capacidad de crear canciones ilimitadas, tenemos solo 14 segundos, pero se puede generar todo cuanto quieras.

No hay comentarios:

Publicar un comentario