domingo, 5 de mayo de 2024

Creación de texto a música (parte 2)

queridos amigos de unidos pa sonar, habíamos quedado en hacer la segunda parte de este interesante artículo de 6 programas para crear tus canciones por medio de texto.

ahora sí, vamos a mencionar las 3 mejores, y en esta contienda están:

Udio, sonauto, y suno.

Registro

en los 3 tienes que registrarte primero, para poder usarlo.

suno acepta cuentas de google, discord, y microsoft.

sonauto, por ahora solo google y discord.

mientras que udio, acepta cuentas de discord, google, facebook, apple, y x.

Interface

en suno, el panel es intuitivo y fácil de usar, está dividido en dos secciones.

el modo básico y el modo avanzado.

en el básico sólo escribes un texto con un promp en inglés de lo que quieres, un pequeño tip.

escribe el promp en inglés y luego la temática de tu canción n español.

ejemplo.

"a 1980s disco song about las mañanas en la escuela".

en el nivel avanzado te encuentras con 3 campos, en el primero escribes la letra de tu canción, si te gusta escribir, desahógate como tu quieras y deja fluir tu imaginación, sino eres de escribir, abre otra ventana con chat gpt y que él te ayude.luego pones el género de la canción recomiendo que este promp sí  o sí tiene que ser en inglés.

y luego el título de tu canción.

en suno no hay mas controles avanzados después de aquí.

ah, la casilla para que tu canción sea instrumental también está disponible.

udio tiene un panel bastante parecido a suno, en el que en un solo prompt escribes lo que quieres, pero si activas la casilla del nivel avanzado, te encuentras con unos controles, que lo que hacen es, que puedes definir cómo quieres tu canción, custom, donde pones la letra que tu quieras o copiala de chat gpt, instrumental es ovbio para hacer tu tema instrumental, auto, en donde udio genera la letra y la música al azar.

udio tiene un sistema especial por si no se te ocurre nada, sino quieres copiar de chat gpt, o escribir ningún prompt, gira el dado y generará la letra, la música y el título sobre un tema aleatorio. El dado está  después del campo de texto, NVDA lo reconoce como un botón.

en sonauto el sistema es casi el mismo, pero su manera de crear música es algo diferente.

Comienzas con darle al botón que dice new project, pones nombre del proyecto y entras en el modo de edición.

en el campo básico solo hay un campo de edición, y la casilla para hacer tu tema instrumental, también hay otra casilla donde entras al modo avanzado, pero este modo avanzado es muchísimo mejor que udio y suno. Dejaré esto para el último ya que  es demasiado interesante lo que puedes hacer en él con sonauto.

Idiomas soportados

suno v1, 13 idiomas, suno v2, 28 idiomas, suno v3, 50 idiomas.

udio: 40 idiomas.

sonauto, 14 idiomas en su versión alfa, veremos su evolución en los próximos dias.

Estatus del servicio

suno: versión final y comercial, sonauto esta en alfa, y udio en beta.

Tegnología detrás

suno nos ha dicho que tiene 3 sistemas con los que trabaja, churp para generar la instrumentación y la que se encarga de mezcla y masterisación de los temas, bark es su sistema de texto a voz que permite sintetizar las voces que cantarán las generaciones, y chat gpt para autogenerar las canciones el sólo.

sonauto tiene su sistema propio llamado melodia, el cual consta de instrumentacion, síntesis de voz, y generación de imágenes para las descargas en video, se encuentra en modo alfa, y poco a poco aprenderá de sus desarrolladores y de sus usuarios.

la gente de udio en cambio, ha sido hermético desde un principio, no se nos ha revelado el sistema que están usando, y prefieren dejarlo así en su versión beta.

Voces

nunca podremos saber cuantas voces tienen los 3 sistemas, cada generación que hagas tendrá una voz distinta, sin embargo en sonauto, puedes controlar que cada generación sea distinta o que la cante la misma voz.

Géneros musicales

suno y udio van a la cabeza en esta parte, ya que soportan todos los géneros musicales posibles, configurados con los idiomas que soportan.

sonauto también soporta varios géneros musicales pero aún le falta aprender, en mis pruebas, el sistema melodia hace grandes generaciones con géneros de música mas antiguos, todavía falla en los géneros de música electrónicos y actuales, pero por estar en modo alfa, sonauto irá aprendiendo.

Calidad en sonido

aquí udio es el ganador indiscutible!, ya que las generaciones están mezcladas, masterizadas, y su sistema de síntesis de voz está avanzado, tanto así que la voz solista como los coros suenan limpias y sin artefactos!.

suno también tiene su puntito a favor, pero hay veces que los coros suenan raros y con artefactos, conciderando que ellos tienen versión comercial de su tegnología, aún así, sus generaciones gozan de un sonido aceptable mezclado y masterizado.

sonauto hace sus intentos, y hay momentos que las generaciones salen con buen sonido, y otras no.

existen momentos en los que la voz esta mas alta que la música, que la voz no tiene efectos, y que hay mucho efecto de reducción de ruidos, sin embargo en los ultimos días esto ha ido mejorando, ya que sonauto se encuentra en constante entrenamiento.

Canciones generadas

en suno y en udio, cada consulta o petición genera dos canciones, en sonauto genera 3 canciones.

Duración de los temas

suno.

version 1, 30 segundos, version 2, un minuto 20 segundos, version 3, 2 minutos.

sonauto, 1 minuto 35 segundos.

udio, 33 segundos.

Extender las canciones

en los tres sistemas puedes extender tus canciones, en suno hasta un maximo de 5 minutos, en sonauto hasta un máximo de 3 minutos, y en udio cada extensión o sección puede extender tu canción por 30 segundos más, asegurando las generaciones que tú quisieras.

Formato de descarga en audio

suno descarga las canciones en mp3 para usuarios gratuitos y pro, los usuarios premium pueden escoger guardar sus creaciones tanto en mp3 como en wav 16 bit, 44 khz.

Sonauto lo hace en formato wav, 44 khz 16 bit.

Udio lo hace en mp3

Cuota gratuita

como es sabido, suno tiene su versión gratuita y otra de pago, ya hemos visto que suno nos da 50 creditos diarios en su version gratis, con el cual generaremos 5 consultas diarias, y cada una nos dará dos canciones, si se te acaban los créditos  espera al día siguiente y se te recargará o compra un plan de pago.

udio está en su versión beta, por lo que n este modo, tendremos 600 peticiones al mes, que nos dan un total de 1200 canciones generadas cada mes. También tienen un límite diario de conversiones, entre 20 a 30 consultas diarias.
Aprobechemos pues el modo beta de udio, ya que pronto se hará comercial y conoceremos sus planes y precios.

sonauto. por ahora en su versión alfa, es gratuito e ilimitado!, no sabemos hasta cuando, pero su  sistema puede ser usado sin límites.

Accesibilidad

suno es la más amigable con lectores de pantalla, pero los que usamos jaws, tenemos que movernos a NVDA para hacer algunas operaciones.

sonauto es medio accesible con jaws, pero es re recomedable  NVDA para usarlo.

udio por ahora sólo puede ser usado con NVDA.

Precios

suno pro, 10 dólares mensuale, suno premium 24 dólares mensuales, descuentos especiales si te supscribes por un año, udio se encuentra en beta, pero pronto se hará comercial y conoceremos sus planes próximamente.

dos huevitos de pascua nos reservan, tanto suno como sonauto.

puedes usar suno directamente desde microsoft copilot, sólo hay que registrarse con microsoft  para usar copilot, luego instalar en copilot el plugin de suno.

su interface es parecida a la versión web, con la particularidad de que solo tenemos un cuadro de texto, para escribir nuestra petición, en copilot no puedes escribir tu propia letra, pero si puedes decirle al sistema  el género   de tu canción y algunos parámetros.

en principio aparecerá la letra y luego de unos minutos aparecerá la canción.

las generaciones en copilot son mas lentas, y no puedes extender tu canción.

y tiene la misma limitación que en la versión gratuita de suno.

y ahora dejo para el final lo que sonauto nos tiene preparado.

cuando melodia evolusione a beta o a versión final, nos encontraremos que sonauto será la herramienta más poderosa que existe en creacion de música con AI.

en el modo avanzado tenemos controles interesantes, que no los vemos ni en suno ni en udio.

Asistente de ritmo

si activamos esta casilla podemos decirle  a sonauto en que velocidad queremos nuestra canción, escribiremos en bpm la velocidad que queremos.

Controlar las voces

aquí en sonauto podemos decirle al sistema con una barra vertical que moveremos a la izquierda o derecha o arriba o abajo, que las generaciones que nos haga, sean con la misma voz de la primera conversion, esto también aplica al género musical que escojamos pues las 3 generacione se harán en el mismo género.

crea tu canción usando referencia de audio!.

al igual que music gen de meta, en sonauto puedes cargar un audio de referencia para tu canción!, sinceramente esta característica es la que me encanta de sonauto  y la cual los productores podemos sacarle muchisimo más probecho.

Cómo se usa

en el modo de edición, antes  que hagas algo,  carga tu archivo de audio, el sistema puede reconocer archivos de audio y trabajara mientras el audio tenga como minimo 1 minuto 30 de duración, lo que significa que puedes cargarle canciones completas al sistema.

una vez cargado el audio, activa el modo avanzado, escribe el genero de música que se asemeje al audio que cargaste o uno diferente para hacer un remix, si te apetece escribe la letra de la canción.

puedes definir si tu generación use la canción completa del audio cargado, o simplemente el ritmo, esta segunda opción esta interesante por si quieres incluir un loop en tu canción.

También hay una perilla la cual sirve para hacer que tu generación de audio sea igual al audio original o totalmente diferente .

sonauto reconoce el ritmo, la entonación, en que nota está, e incluso puede generar una voz bastante parecida al del audio de referencia.  Luego que definas los parámetros le das al botón que dice, generate with reference.

tardará un poco más en generar tu audio, pero los resultados son realmente asombrosos!.

con esta característica puedes transformar tu canción favorita a una distinta, cambiarle de idioma a tu canción, escribir una letra sobre un tema instrumental, las posibilidades son infinitas.

Según los creadores de sonauto, cada vez que un usuario sube su audio a la IA, esta ayudando al aprendisaje de su sistema melodia, de modo que mientras mas audio subamos, el sistema aprenderá mas géneros y voces.

Crear tu música usando un piano virtual!

en sonauto puedes hacer una canción usando de referencia una melodía que toques en su piano virtual en web.

para activar esta característica entra al modo avanzado, le das donde dice use virtual piano, y entonces tocas notas con tu teclado de la pc o laptop.

el audio generado tendrá de referencia las notas que tocaste en el piano virtual. próximamente tendremos la creación de música sobre un archivo midi.
¿Mi favorita?

ciertamente, ahora ya no se que pensar, hace unos días dije que suno era la mejor, pero udio nos dio mas calidad en conversiones pero sonauto tiene cosas más buenas para DJ's y productores, ahora con esto no tengo mas que decir, las tres son buenas!. 

Creación de texto a música (parte 1)

que tal amigos de Unidos pa sonar, estuve estos días probando inteligencias artificiales que nos permiten hacer canciones con un solo prompt de texto, y he probado 6.

ojo que entre esas 6 también estuvo nuestro querido suno, pero no hablaré de él por el momento.

este artículo será dividido en dos partes, en cada uno hablaré de 3 de las 6 herramientas de creación de musica con AI

en la primera parte mencionaré las menos importantes, y el la segunda parte las que todos usamos, inclusive suno.

compararemos sus pro y sus contra.

en la primera parte de este artículo tenemos a:

riffusion, voice mod text to music, y song R.

son las menos importantes pero vale la pena mencionarlas, pues en algún momento necesitaremos de ellas.

registro

tanto en song r como en voicemod tendrás que registrarte para poder usarlo.

en el caso de voicemod no se permite registrarte con google o facebook, ahí te registras con nombre de usuario y contraseña.

song r por el contrario, para generar canciones no  es necesario registrarte, pero para descargar en audio tus creaciones o compartirlas ahí si tienes que hacerlo.

en riffusion sí puedes hacer igual que suno, escribir el ritmo, el genero y hasta las voces, en cuanto a song r solo puedes escribir la letra o generarla desde ahí mismo, generará canciones bazados solo en 6 géneros musicales, voicemod es muchísimo más limitado, pues generará sobre 8 canciones predefinidas, en el futuro se sumarán más canciones.

Idiomas soportados

por desgracia estas 3 herramientas sólo soportan el idioma inglés, si no sabes inglés entra a chat gpt escribe algo en español y que chat gpt te lo traduzca, luego aquel texto pégalo en cualquiera de las 3 herramientas.

Voces

riffusion tiene una cantidad infinita de voces que va cambiando con cada generación casi igual que suno.

voicemod, cuenta con un pequeño catálogo de 20 voces, que se irán sumando mas en el futuro.

song r por el contrario, sólo tiene 3 voces, una masculina y dos femeninas.

Géneros musicales

riffusion puede soportar cualquier género musical, pero no del todo, pues su inteligencia artificial está entrenada mas en la música americana, es posible crear hip hop, rap, soul, country, funkey, EDM, trap, en generaciones que no estén en estas categorías, por ejemplo algún género latino, siempre falla.

song r, tiene solo 6 géneros musicales, pop, electrónica, hip-hop, rock, cafe, y childrens.

voicemod es muchísimo más limitado pues solo se limita a 8 canciones predefinidas, una de eminem, otra de ariana grande, otra de otro rapero que no recuerdo su nombre, y algunas más incluyendo el cumpleaños feliz.

Calidad de las voces

en los 3 casos, sus voces son bastante buenas y realistas, en voicemod, se oye un tanto sintetizado como si fuese vocaloid.

Calidad de la música

riffusion tiene una calidad súper buena tanto en la música como en la de las voces, song r te genera nuevas melodías pero casi siempre son aburridas, y gran parte de ellas  están en la menor o la mayor.

voicemod, solo toma los estribillos de sus 8 canciones para generar dis que una canción nueva.

y que pasa si escribo en español o  algún otro idioma?.

en riffusion y song r, no ocurriría nada, solo que lo que escribas en español tendrá un fuerte acento americano.

voicemod en cambio cuida de que no se escriban cosas que no sean en perfecto inglés, cuando intentas escribir algo en otro idioma,  el sistema piensa que estas generando contenido prohibido y no genera tu canción, y te advierte que si haces esto 3 veces serás baneado.

Duración de las generaciones

song r, puede generar canciones hasta de 3 minutos si lo deseas, en este aspecto song r le gana incluso a las más importantes!

en riffusion son 14 segundos.

y en voicemod, son 10 segundos, o quizás menos si usas la plantilla del cumpleaños feliz.

en voicemod dentro de sus 8 canciones puedes escribir cuanto quieras, pero generará solo 10 segundos de audio.

sin embargo, si escoges la plantilla de cumpleaños feliz, el texto escrito será mas corto, y tendrás entre 15 a 20 caracteres para escribir, esto es por que la plantilla ya canta el happy birrthday to you, y solo hay espacio para poner el nombre del cumpleañero.

Limitaciones

riffusion y voicemod te permite crear canciones ilimitadas, song r puede generar canciones ilimitadas, pero solo te permite 5 descargas, al acabar las 5 descargas, tendrás que comprar su suscripción.

Mi favorita

obvio que mi favorita es riffusion, por tener una calidad parecida a suno, y por su capacidad de crear canciones ilimitadas, tenemos solo 14 segundos, pero se puede generar todo cuanto quieras.