Entrada actualizada incluyendo varias modificaciones. Algunas de ellas son menores, aunque útiles, y otras son especialmente interesantes, como la descripción de la persona y un método alternativo para poder hacer la persona con nuestra voz, pues el método principal ahora mismo da algunos problemas.
Seguro que conocéis la herramienta de creación musical por medio de Inteligencia Artificial Suno AI. En SucDePoma ya hemos publicado un par de artículos sobre ella y probablemente ya habéis hecho alguna que otra cancioncita. Pues bien, ¿qué os parecería dar un paso más allá y poder emplear vuestra propia voz para crear canciones? No hace falta que sepamos cantar. Suno se encarga de hacer magia y que de repente seamos unos cantantes estupendos. ¿A que suena bien? Pues si os interesa el tema, en este tutorial encontraréis todo lo necesario para conseguirlo. Ah, y al final hay varios ejemplos musicales empleando esta función. No os los perdáis.
Índice:
Introducción
Ya sé que estáis impacientes por saber cómo realizar el proceso de clonar nuestra voz, pero antes, permitirme comentar algunas cosas interesantes a tener en cuenta:
- Esta guía se ha creado empleando suno AI en el navegador Microsoft Edge, en un PC con Windows 10 y el lector de pantalla NVDA. Según mi parecer, es la combinación más accesible y usable. Por lo que puede ser distinto en otros sistemas operativos, navegadores, o en la aplicación Suno para iOS y Android. Puede que incluso resulte menos accesible. O quien sabe, igual es más accesible. No obstante, os puede servir de guía indicativa de los pasos a seguir.
- Suno denomina como “Persona” a los cantantes que creemos con nuestra voz. Pues bien, para poder crear estas personas hay que tener la versión de pago de Suno. No está disponible en la versión gratuita. Esto significa que, al igual que las canciones que creamos con la versión de pago, la propiedad intelectual de esas personas con nuestra voz nos pertenece por completo. Eso sí, tal y como veremos más adelante, es muy importante que a la hora de crear la persona, desmarquemos una casilla que aparece verificada por defecto y que hace que sea pública. A no ser que os interese hacerlo así.
- La página web de Suno AI es bastante compleja, con muchos botones. Es recomendable perder un ratito en ensayar técnicas de navegación que nos simplifique la navegación. Yo uso mucho los siguientes atajos con NVDA (seguro que hay más, pero son los que mejor me funcionan):
- La combinación “Control + Inicio” la uso mucho para ir al principio de la página y poder navegar siempre desde un punto fijo de referencia.
- Una vez en el inicio de la página, siempre presiono una vez la tecla “N”, para saltarme todos los menús de la parte superior y luego ya presiono la tecla “B” para localizar los botones principales. Por ejemplo, el que permite seleccionar el modo sencillo de creación musical “Simple”, el avanzado “Advanced”, el que permite subir una muestra de audio “Add audio”, el que permite seleccionar una persona que hayamos creado previamente “Add Persona”, así como para acceder a los apartados para introducir la letra de la canción “Lyrics”, o al que permite introducir el estilo de la canción “Styles”.
- Todos los botones de la página se pueden activar perfectamente presionando la barra espaciadora.
- Los apartados “Lyrics” y “Styles” se pueden expandir y contraer. Una vez les hemos introducido la información necesaria, conviene contraerlos para que el interfaz permanezca lo más simple posible. Sobre todo el de los estilos, pues aparecen una infinidad de sugerencias.
- Para ir a la tabla de resultados en las que aparecen las canciones, lo ideal es presionar “Control inicio” y luego la letra “T” (En JAWS esto no funciona. Hay que presionar dos veces la letra “N” para llegar al botón que permite editar el título de la primera canción de la tabla y luego subir con dos toques de la flecha superior del cursor para llegar al botón de reproducción).
- Antes se podía navegar por la tabla de las canciones con las combinaciones de teclas correspondientes a las tablas, pero ahora no se puede. Lo que hago es una vez en la tabla, voy presionando la letra “N” para ir al botón que permite editar el nombre de cada canción y luego subo para arriba al botón de reproducción. Puede que en próximas actualizaciones la tabla vuelva a funcionar como antes, pero de momento me vale.
- Al reproducir una canción, podemos hacerlo desde el botón correspondiente de la tabla de resultados, pero si queremos adelantar su reproducción, o acceder al botón que permite acceder a las opciones avanzadas relacionadas para esa canción, lo adecuado es presionar “control + fin” para ir al final de la página y allí encontraremos de forma más rápida todo ello.
Primer paso: Grabar una muestra de sonido cantando
Empezamos. Lo primero que hay que hacer es grabar una canción que servirá como muestra para samplear y clonar nuestra voz. Aquí tenéis algunas cosas a tener en cuenta para hacerlo de forma correcta:
- No hace falta que cantemos muy bien, pero es necesario que sea una canción en la que podamos emplear varios registros y rangos vocales: graves, agudos, etc. De esta forma, la IA tendrá más información a la hora de clonarnos y el resultado será mucho mejor. No es útil subir un audio en el que tan sólo estemos hablando. En ese tipo de muestras no hay información ni referencias vocales suficientes, por lo que la IA mantendrá nuestro timbre en las partes medias, pero el resto será una interpretación genérica del modelo. Es decir, que se lo inventará y no nos reconoceremos.
- Tenemos que cantar de forma natural y clara, sin impostar la voz, pues el objetivo es conseguir algo natural y fiel al timbre y la textura de nuestra voz, a la vez que la muestra es clara y con buen audio.
- Da igual que canción empleemos. Yo he usado una infantil de la que me acordaba y con la que me sentía a gusto al cantarla. Esto es importante, pues así no estamos concentrados en acordarnos de la letra y nos podemos centrar en lo realmente importante, es decir, en cantarla lo mejor y más natural posible.
- La canción no debe tener copyright, si no, no deja subirla.
- Yo he subido las canciones tanto en formato MP3 como en Wav. Suno recomienda hacerlo en WAV o FLAC, pues permite una mayor calidad de sonido (por supuesto, siempre y cuando la calidad de la grabación aproveche ese formato de mayor fidelidad).
- Según suno, debe tener entre 6 segundos y 30 minutos, pero se refiere a los límites para subir audio. A nosotros nos basta con una grabación de 30 segundos como máximo, pues a la hora de crear la persona, ese es el límite máximo de la muestra que se emplea. Por lo tanto, es absurdo grabar más tiempo. A no ser que luego queramos seleccionar un fragmento concreto de nuestro audio, pero creo que es innecesario y añade algo de dificultad al proceso.
- Podemos grabarla en una grabadora física, en la app notas de voz del móvil, o en la misma herramienta de Suno si tenemos un buen micrófono conectado al ordenador. Hay que grabarla con la mejor calidad posible. Si la grabamos en la app Notas de Voz el iPhone, hacerlo con la mayor calidad, es decir, sin pérdidas y casi mejor en mono. Yo lo hice así, luego la compartí con el PC a través de una nube y allí la convertí a formato WAV.
Segundo paso: Subir la muestra de audio a Suno
Ahora toca subir nuestra canción a Suno (acordaos de usar los atajos de teclado que he comentado anteriormente para llegar de forma rápida a los distintos botones):
- En la página web de Suno AI entrar en la sección “Create” y seleccionar el modo avanzado “Advanced”.
- Presionar en el botón multifunción “Add audio – Remix, upload, or record audio”.
- Ir al final de la página y presionar en “Upload” para subir la grabación (también aparece la opción de grabar directamente por si tenemos un buen micrófono conectado al ordenador). Se abre la típica ventana para buscar y abrir un archivo en el ordenador.
- Una vez hemos subido el audio, pulsamos “Save” en la pantalla que se abre.
- Aparece una ventana para especificar que queremos hacer con el audio. Ésta desaparece al cabo de unos pocos segundos, por lo que hay que pulsar rápido primero en un botón que es para guardarlo en la biblioteca para poder usarlo posteriormente, y luego en “Continue”. Da tiempo, pero no hay que tardar mucho. Si no hacemos esto, no sé qué opción se selecciona de forma predeterminada. Alguna vez me ha ocurrido por estar despistado, pero luego he podido emplear el audio sin problemas. No obstante, prefiero pulsar esos botones.
Tercer paso: Crear un sample con nuestra muestra de sonido
Bien. Ahora toca crear un sample con la muestra que acabamos de subir. Para ello:
- El audio con nuestra muestra de sonido recién subida aparece en la tabla de las canciones, por lo que nos vamos allá y lo reproducimos. Luego lo pausamos. De esta forma queda cargado en el reproductor de la parte inferior de la página.
- Nos vamos abajo del todo de la página, al botón “More menu contents” correspondiente a ese audio. Mejor hacerlo abajo del todo, en la zona del reproductor.
- En el desplegable que se abre, presionamos primero en el submenú “Remix/Edit”, luego vamos más abajo y presionamos en “Sample this song”.
- Aparentemente no ocurre nada, pero ahora ya tenemos cargado ese audio como un sample para hacer una canción. Si nos vamos por arriba, debajo de un botón llamado SampleBeta, encontramos un reproductor con el audio cargado. Podemos reproducirlo un instante para asegurarnos de que es el correcto y luego lo pausamos. Aquí no hay que hacer nada. Se podría seleccionar una zona de la grabación para que sirva de sample. Hay dos cuadros de edición para especificar la franja que queremos seleccionar. Si no especificamos nada, se emplea todo el audio.
Cuarto paso: Crear canciones con el sample hasta obtener la adecuada
Ahora debemos ir creando canciones hasta que consigamos una que nos guste. Pasos a seguir:
- Iniciamos el proceso para crear una canción. No hay que poner nada en el campo “Lyrics”, es decir, en el cuadro de edición de la letra. Se trata de que la propia herramienta emplee nuestro audio sampleado, con la letra de la canción que hemos cantado.
- En “Styles” ponemos:
Clear spanish male voice vocals with piano solo.
Si somos mujer, ponemos female en vez de male. Y podemos especificar el idioma, o incluso si queremos que tenga cierto acento, por si la aplicación no lo capta bien. Por ejemplo, español de Méjico. Yo he puesto, lo de spanish, pues no sé por qué tendía a ponerme acento italiano, y al especificar el idioma, ya no me lo hizo más.
Se trata de conseguir una canción con solo un instrumento, pues luego hay que aislar la pista vocal, y de esa forma quedará mejor.
Obtendremos algunas canciones sólo instrumentales y otras que inicialmente también lo parecen, pero que al rato sale la voz. Esto segundo es lo habitual, por lo que hay que escucharlas hasta el final. Según he observado, por regla general la voz suele aparecer hacia la mitad de la canción. En ocasiones incluso más tarde.
- Antes de crear la canción hay que ir al “More Options” que hay encima del cuadro de edición para ingresar un título a la canción, desplegarlo, y poner los deslizables de las rarezas Weirdness en cero, el de Style Influence en 50, y el de Audio Influence en 100. Todo esto es para que la voz resultante sea lo más fiel posible a la del audio original. Es decir, la primera barra en cero, la segunda en 50 y la tercera en 100. O al menos eso es lo que hago yo y con lo que he conseguido resultados más fieles a mi voz. Podéis ir probando distintos porcentajes para comprobar los resultados.
- Le ponemos un título e iniciamos la creación pulsando el botón “Create song”. Hemos de crear varias, hasta conseguir una que nos guste, en la que nuestra voz se parezca bastante. A la hora de crear más canciones con ese sample, no hay que volver a cargar su audio, permanece ya ahí, por lo que podemos ir creando canción tras canción hasta obtener la que nos guste. Tan sólo tenemos que irles cambiando el título para diferenciarlas.
- Empezamos a reproducir la canción obtenida en la tabla de las canciones, pero tras iniciar su reproducción es mejor pausarla e ir al final de la página, al reproductor inferior. Allí la volvemos a reproducir y nos vamos a la barra deslizable del tiempo, la activamos con barra espaciadora y con cursor derecho vamos avanzando para ver si aparece nuestra voz cantando. De esta forma se ahorra mucho tiempo. Si bajamos muy deprisa, inmediatamente después de obtener la canción, y empezamos a avanzar rápidamente con este deslizable, llegará un momento en el que se pausará la reproducción. Imagino que esto es debido a que la herramienta aún está creando la pista y nosotros vamos más rápidos que ella. Así que paciencia.
- Para escuchar la segunda de las canciones que obtenemos con cada creación musical no hace falta subir a la tabla superior de las canciones, desde el reproductor inferior podemos pasar a escucharla pulsando el botón “Next Song button”. También podemos escuchar las canciones previas desde aquí, en este caso presionando en “Previous Song button”.
Quinto paso: Separar las pistas vocal e instrumental de la canción que nos gusta
Bien. Ya tenemos una canción en la que nuestra voz es fiel a la realidad y que nos gusta. Ahora hay que separar sus pistas vocal e instrumental para aprovechar la que tiene nuestra voz. Suno denomina a estas pistas con el nombre de Extends. Los pasos:
- Cuando obtengamos una canción que nos guste especialmente, la pausamos y pulsamos el “More menu contents” que hay al final de la página.
- En el desplegable seleccionamos “Get extends”. Esto es para separar la pista vocal y la instrumental.
- Se nos ofrecen dos opciones para separar las pistas de la canción: una Full Song, que cuesta 50 créditos y que es capaz de separar hasta 12 instrumentos y voces distintas, y otra que cuesta 10 créditos, que tan sólo separa una pista vocal y otra instrumental. Se selecciona esta segunda. Ya es suficiente.
- Las pistas o Extends no se muestran inicialmente en la tabla de los resultados. Para que se muestren, antes de la tabla aparece un botón que dice algo así como “4 new clips hidden by current filters”. Hay que pulsarlo. Se puede llegar directamente a él, presionando primero “Control + Inicio” para ir al inicio de la página, y luego la letra “T” (al menos en NVDA, en JAWS, tal y como he comentado anteriormente, es distinto). Es importante hacer esto en este paso, pues si cerramos el navegador, o realizamos cualquier otra acción dentro de la página, como por ejemplo, crear una nueva canción, ya no se muestra ese botón. Si se da el caso, hay que entrar en “My Workspace” y acceder al menú de los filtros para hacer que se muestren los extends y ahí ya es más complicado e incluso inaccesible.
- Ahora hay que buscar el extend en el que está la voz sola. Yo siempre consigo como resultado 4 (2 vocales y 2 instrumentales). He leído por ahí que se obtienen sólo uno de cada, pero de momento siempre obtengo 2 de cada. No sé si se trata de un error, o qué. Vale la pena escuchar bien los dos vocales, pues aunque parecen idénticos, suele haber diferencia en la calidad de sonido. En algunos se escucha algo de ruido blanco de fondo y en otros el sonido está totalmente limpio. También suele haber diferencia en la reverberación que se le aplica a nuestra voz. En ocasiones, en uno de los audios aparece algo distorsionada. Hay que seleccionar el que tenga mejor calidad.
- Lo recomendable es empezar su reproducción arriba, en la tabla, pero desplazarnos inmediatamente al reproductor del final de la página, pues la voz suele empezar hacia la mitad de las canciones y nos irá muy bien el poder avanzar con rapidez desde la barra de desplazamiento de la reproducción. Acordaos que desde aquí abajo podemos pasar a escuchar las siguientes canciones hasta llegar al segundo extend.
Sexto paso: Crear una persona con el extend vocal ideal
Ya estamos en el último paso. Ahora toca crear la persona con nuestra voz:
- Una vez localizamos el extend vocal que nos interesa, lo pausamos y pulsamos en el “More menu contents” del final de la página.
- En el desplegable, pulsamos el submenú “Create” y luego, más abajo en “Make person”.
- Aparece una ventana para etiquetar la persona. Aquí se podría seleccionar un trozo concreto del audio para que sirva de muestra, pero si la canción que hemos subido es de 30 segundos no será necesario (os recuerdo que ese es el máximo que se puede seleccionar). Si nuestro audio supera los 30 segundos, hay dos cuadros de edición por si queremos especificar un fragmento concreto. El primero es para el punto de partida y el segundo para el final de la selección. Si no lo hacemos, se usarán los primeros 30 segundos.
- Etiquetamos la persona con un nombre.
- Podemos agregar una descripción. En principio no es necesario. Yo he obtenido buenas canciones sin ella, pero puede ser útil para solucionar algunas cosas. Mi consejo es que inicialmente no pongamos nada aquí, al menos hasta que comprobemos qué tal se comporta nuestra voz. Encontraréis más información sobre las descripciones en el encabezado “Descripción de la persona (identidad vocal)”.
- Es muy importante desmarcar una casilla que hay antes de donde pone «Public», pues viene activada por defecto, haciendo que nuestra persona sea pública. Al desmarcarla pasa a ser privada. A no ser que queramos que sea pública.
- Finalmente, la guardamos pulsando en “Save”. Si nos olvidamos de hacerla privada, al abrir la persona desde el botón ADD Person de la pantalla principal del modo avanzado, también está esta misma casilla de verificación.
- Podemos crear tantas personas como deseemos. Tanto con voces que subamos a la aplicación, como con voces de la propia herramienta. Es decir, en ocasiones obtenemos una canción con una voz de Suno que nos gusta especialmente. Pues bien, podemos extraer los extends de esa canción y crear una persona con esa voz. De esa forma nos aseguramos de hacer canciones con ella, pues ya sabéis que suno emplea sus voces de forma bastante aleatoria.
Descripción de la persona (identidad vocal)
Introducción a la Descripción de la persona
A la hora de guardar nuestra persona por primera vez, o a la hora de editar una que ya tengamos creada, nos encontramos con un cuadro de edición para incluir una descripción que le agregará cierta identidad vocal. Se podría decir que es una especie de dosier con las características vocales de la persona. El objetivo es definir quién está cantando, no el género de la canción, y que suno lo tenga en cuenta a la hora de crear las canciones. Para lo segundo, para definir el género o estilo, ya hay un cuadro de edición llamado “Styles”, que no es necesario rellenar. A no ser que nos queramos dedicar a cantar un estilo musical muy concreto, que además se corresponda con la canción que hemos subido de muestra.
Tal y como he comentado anteriormente, en principio no es necesario añadir nada en la descripción. Es más, mi consejo es que inicialmente no se ponga nada en este campo y probar a ir haciendo canciones con la persona a ver qué tal se comporta en los distintos estilos musicales. Si se nota aluna carencia o problema, entonces ya sí que se puede probar a solucionarlo con la descripción. Por ejemplo, algo que suele ocurrir es que nuestra voz cante con un acento que no es el nuestro. Eso es algo que me ocurría a mí de forma esporádica, pero que se ha solucionado con la descripción. Otra cosa que me ocurre, es que como mi voz es muy suave y no soy capaz de grabar una muestra de mi voz cantando de forma enérgica y alcanzando notas altas (al menos sin sentir que falseo mi voz de forma poco natural), cuando me pongo a crear canciones que requieren ese tipo de voz, como suno no tiene esa información vocal, tiende a inventarse cómo sería mi voz en esas circunstancias, y claro, ahí ya no me reconozco. Soy consciente de que he de intentar esforzarme más para realizar una muestra que suministre esa información vocal, pero ya digo, me resulta complicado hacerlo sin falsear mi voz. Lo he intentado, pero la persona resultante no me convence. No me reconozco en ella. Pues bien, mientras encuentro una solución, he especificado en la descripción ciertos detalles que palían algo el tema (al menos en ciertos estilos musicales, en otros, es imposible).
Lo que escribamos aquí se puede hacer en español, pero al igual que con lo que se introduce en el campo del estilo de la canción a crear, si lo hacemos en inglés suele ser más efectivo.
Por cierto, hay que tener cuidado de no incluir palabras, ya sea en español o inglés, que se correspondan con el nombre de un grupo musical o con una franquicia relacionada con la música. Si no, nos dará un error y no podremos guardar la persona con esa descripción. Por ejemplo, si ponemos en inglés que la voz de la persona es tal y cual, en inglés es “The voice” y no nos lo permite. En su lugar hemos de poner que su voz es tal y cual.
Comentar también que al añadir una descripción a una persona ya creada, puede darse el caso de que suene distinta. Por supuesto, esto puede ser por no acertar en su descripción, pero me he encontrado que con un ajuste distinto del deslizable de la influencia del audio la voz vuelve a sonar bien, y además, beneficiándose de lo que he añadido en la descripción. Me ha pasado con una de mis personas. Tuve que bajar ese deslizable desde el 100% al 89% para que volviese a sonar como siempre, pero curiosamente, al día siguiente, tuve que volverlo a poner al 100%. Igual fue una anomalía de la versión beta, pero bueno, lo comento por si os pasa.
No os preocupéis si al añadir una descripción desgraciáis la voz de una persona, basta con acceder a su edición y eliminar lo que hayáis puesto en la descripción. Al hacer eso, afortunadamente vuelve todo a la normalidad.
Y una última cosa a tener en cuenta. Para poder aprovechar al máximo la influencia de la descripción en nuestra persona, se debe utilizar el nuevo modo vocal “Voice Persona (new)” presente en el último motor de generación musical de suno, la versión 5. No obstante, no os preocupéis, pues ese modo ya está seleccionado por defecto. No hay que hacer nada. A no ser que voluntariamente hayamos cambiado a alguno de los otros dos modos vocales: el “Better vocal consistency” y el “Style Persona (legacy)”. De todas formas, lo comento porque conviene saber dónde se puede seleccionar, por si hay algún problema y es necesario activarlo. Esto se hace desde la pantalla de creación musical “Advanced”, pulsando el botón sin etiquetar que hay justo debajo del nombre de la persona que hemos seleccionado para cantar (se encuentra entre su nombre y el botón “Remove selected persona”). Al pulsarlo, si nos vamos al final de la página encontraremos 3 botones con los distintos modos vocales, entre ellos el mencionado “Voice Persona (new)”.
Aspectos a añadir en la descripción
A continuación tenéis algunos ejemplos orientativos de lo que se puede añadir en el cuadro de la descripción. Por supuesto, se puede poner cualquier otra cosa que se nos ocurra y que creamos que puede ser útil para mejorar la voz de nuestra persona, pero cuidadito con lo que se hace:
- Demografía e idioma: Se puede especificar el género (masculino/femenino), la edad aproximada, la nacionalidad y el acento (por ejemplo, español de España con un acento castellano neutro).
- Timbre vocal: Si lo sabemos, podemos definir el tipo de voz (tenor, barítono, bajo, soprano, mezzo-soprano o contralto). También se puede describir la textura física de la voz (si es rasposa en registros bajos, si es suave, aireada, clara, desgastada o nasal). Si no tenemos ni idea de estas cosas, no pasa nada y no lo especificamos. Mejor no agregar cosas que puedan desgraciar nuestra voz.
- Entrega Técnica: Podemos detallar cómo canta nuestra persona. Por ejemplo, si usa un falsete suave, si tiene una enunciación clara y precisa, un arrastre perezoso, si tiende a usar un vibrato, o una cadencia rápida tipo rap. También podemos especificar el tema de la dinámica, es decir, si solemos pasar de un susurro rudo a una entrega potente, o si usamos cambios dinámicos frecuentes.
- Contexto Emocional: podemos definir el sentimiento habitual de nuestra voz, como melancólica, agresiva, vulnerable, confiada, alegre, o siniestra.
La descripción debe ser clara en los conceptos y no muy larga, pues si no, puede confundir a la IA y afectar negativamente a la voz de nuestra persona, dejando de ser útil. Se debe enfocar estrictamente en las características que creamos realmente importantes y que controlemos, evitando introducir cosas innecesarias, así como nomenclatura técnica que desconozcamos.
Si hacemos bien la descripción, no tan sólo se solucionarán aquellas carencias que hayamos observado en nuestra voz, también permitirá que ésta se mantenga consistente aunque el género musical cambie radicalmente (por ejemplo, al pasar de una balada pop a una canción de rock). No obstante, hay voces que a pesar de todos nuestros intentos, no quedarán bien con ciertos estilos musicales, pues la IA hará lo posible para hacerla encajar, rellenando las carencias de la muestra original, y es muy probable que no nos reconozcamos en la canción resultante. Tenemos que ser conscientes de nuestro tipo de voz y limitarnos a emplearla en aquellos estilos en los que encaje.
Ejemplos de Descripciones
Ejemplo de una descripción bastante técnica:
Cantante masculino de unos 30 años. Español de España con acento castellano neutro. Tenor, con una voz suave, pero con un ligero toque rasposo. La entrega es emocionalmente vulnerable, utilizando falsetes frecuentes y una enunciación clara pero melancólica. El tono tiene una calidez natural similar a la de un artista de indie-folk contemporáneo.
En mi caso, no me he complicado mucho, y tras probar varias cosas, en la descripción de mi persona tan sólo he añadido algunos detalles que me han resultado especialmente útiles. Ya que Os he comentado antes las carencias y problemas que tenía con la muestra de mi voz, os los comparto a modo de ejemplo (os los pongo en español, pero a la hora de incluirlos en la descripción, los he traducido al inglés):
Cantante masculino de unos 40 años. Español con acento castellano neutro de Madrid. Su voz es dulce, cadenciosa y lenta. Se mantiene constante con esa cadencia y características durante todo el transcurso de la canción. Incluso en registros altos o cuando la intensidad aumenta, su voz mantiene esas características.
He puesto lo del idioma y acento para solucionar cierto acento andaluz que aparecía de forma esporádica en las canciones. Por otro lado, aunque mi voz no es especialmente lenta, al ponerlo evito que la IA la suba en intensidad y deje de reconocerme en ella. Además, en según qué estilos musicales, también añado instrucciones precisas en el cuadro del estilo musical para intentar evitar situaciones en las que mi voz deja de ser reconocible. De todas formas, hay algunos estilos en los que cualquier intento es infructuoso. Soy consciente de que estos problemas se solucionarían con una muestra de audio en la que cante con más registros vocales. Así que intentaré hacerlo.
Cómo seleccionar, utilizar y gestionar las personas que hemos creado
Cómo seleccionar y utilizar una persona
Tras crear una persona, ya queda seleccionada para poder hacer canciones de forma inmediata con ella. Pero si cerramos el navegador, deberemos seleccionarla. Para ello:
- Cuando deseemos crear una canción empleando nuestra voz, hay que seleccionar el modo “Advanced” y presionar en “Add persona”.
- En la pantalla que se abre hay que pulsar «Intro» en el gráfico de la persona. El lector de pantalla dice que es un clickeable.
- Iniciamos el proceso de creación musical de la forma habitual.
Cómo cambiar de persona
- Si deseamos cambiar de persona, estando en la pantalla de creación “Advanced”, debajo del botón con el nombre de la persona que tenemos seleccionada en ese instante, hay un botón llamado “Remove selected persona”. Esto borra su selección. No la elimina. Lo pulsamos.
- Luego seleccionamos otra persona desde el botón “Add persona”.
Nota: En más de una ocasión, al cambiar de persona, la que he seleccionado a continuación no se ha mostrado en la pantalla de creación. En esos casos reinicio el navegador y la cargo desde cero.
Cómo eliminar una persona
Para eliminar una persona:
- Estando en el modo “Advanced”, pulsamos el botón “Add persona” y luego seleccionamos la persona que deseamos eliminar.
- Una vez tenemos la persona en la pantalla de creación, entramos en ella, pulsando en su nombre.
- Presionamos en el “More options” que hay un poco más abajo de su nombre y en el submenú que se despliega pulsamos en “Move to Trash”.
- Tras eliminarla, volvemos a encontrarnos en la pantalla de la persona. Pulsamos el botón “Create with Persona” que hay un poco más arriba del “More options” que hemos presionado anteriormente. Esto nos lleva a la pantalla principal de creación.
- A pesar de haberla eliminado, la persona sigue estando en la pantalla principal de creación. Pulsamos el botón “Remove selected persona”.
Cómo editar una persona
Si deseamos cambiarle el nombre a una persona, así como añadir o modificar su descripción:
- Estando en el modo “Advanced”, primero hacemos que la persona que deseamos editar aparezca en la pantalla principal de este modo. Ya sabéis, pulsamos el botón “Add persona” y luego seleccionamos la persona que nos interesa.
- Entramos en la persona, presionando en su nombre.
- Presionamos en el “More options” que hay un poco más abajo de su nombre y en el submenú que se despliega pulsamos en “Edit”.
- Una vez dentro de la edición, modificamos lo que nos interesa y luego pulsamos en “Save”.
- Tras guardar los cambios, volvemos a encontrarnos en la pantalla de la persona. Pulsamos el botón “Create with Persona” que hay un poco más arriba del “More options” que hemos presionado anteriormente. Con esto volvemos a la pantalla principal de creación.
Cómo perfeccionar nuestras personas con una mejor voz
Si en la muestra original con la que hemos creado una persona no hemos cantado muy bien que digamos y nos gustaría que ese clon cantase aún mejor, o si simplemente queremos mejorar aún más su voz, recomiendo encarecidamente crear una nueva persona a partir de la mejor persona que hayamos conseguido previamente. El objetivo es mejorar nuestra voz, pero de forma que aún nos sigamos reconociendo en ella. Para esto hay que realizar lo siguiente:
- Debemos crear una canción con nuestra persona, con la letra que deseemos y con tan sólo un instrumento. Puede servir el estilo descrito en el cuarto paso de este tutorial, Clear spanish male voice vocals with piano solo. Se trata de conseguir una canción con la menor presencia de instrumentos posible, en la que cantemos bien y en la que nos reconozcamos perfectamente.
- Una vez la conseguimos, la pausamos, nos vamos al final de la página, pulsamos en el botón “More menu contents” y luego en “Get Stems”, para separar las pistas vocal e instrumental.
- Seleccionamos la opción básica de 10 créditos.
- Nos vamos a la tabla de los resultados y presionamos en el botón “4 new clips hidden by current filters”, para mostrar los extends.
- Reproducimos los extends vocales y nos quedamos con el que mejor se escuche. Lo pausamos.
- Luego nos vamos al final de la página para pulsar en el botón “More menu contents”, después en “Create” y finalmente en “Make Persona”.
- Le ponemos un nombre a la nueva persona, desmarcamos la casilla que la hace pública y la guardamos.
Método alternativo para clonar nuestra voz
Algunas personas estamos teniendo problemas para aplicar el paso para conseguir canciones con el sample tal y como está descrito en las anteriores líneas. No hay forma de obtener canciones con nuestra voz con las que separar posteriormente la pista vocal. Inicialmente iba perfecto, pero desde hace algunos días no funciona. Esperemos que sea algo temporal, debido a que es una función en beta. Mientras tanto, a continuación tenéis un método alternativo con el que incluso se obtienen las canciones con el sample de forma más rápida. Aunque me da la impresión que con éste otro método la calidad de la voz de la persona que se crea es algo inferior a la que se conseguía con el anterior. O al menos esa es mi impresión. Por supuesto, eso también depende de la calidad vocal de la muestra subida.
Aquí están los pasos:
- Realizamos los dos primeros pasos tal y como están descritos en el anterior método. Es decir, primero grabamos nuestra canción y a continuación la subimos a Suno presionando primero en el botón “Add audio – Remix, upload, or record audio” y luego en el botón “Upload” que hay al final de la página.
- Ahora tenemos dos posibilidades:
- La primera es quizás la más sencilla. Consiste en tener escrita previamente la letra de lo que hemos cantado en la muestra que hemos subido, incluyendo las meta etiquetas básicas de la estructura. La necesitamos para pegarla luego en el cuadro de la letra “Lyrics”.
- La otra opción es copiar la letra de lo que hemos subido desde el Editor de Audio de suno. Para esto, tras reproducir y pausar la muestra que hemos subido, nos vamos abajo del todo de la página, al botón “More menu contents” correspondiente a nuestro audio y lo pulsamos. En el desplegable que se abre, presionamos primero en el submenú “Remix/Edit”, luego vamos más abajo y presionamos en “Open in Editor”. Una vez en la pantalla del editor, tenemos que copiar la letra de la canción que la IA ha reconocido en la muestra que hemos subido. Aparece incluso con las meta etiquetas de la estructura. Copiamos todo y la pegamos momentáneamente en una nota del Bloc de Notas. Finalmente, volvemos a la pantalla principal de creación avanzada “Advanced” pulsando el enlace “créate” que hay en el menú superior.
- Creamos un sample con la muestra subida. Ya sabéis, la reproducimos, nos vamos al final de la página, para presionar el botón “More menu contents”. En el desplegable que se abre, presionamos primero en el submenú “Remix/Edit”, y luego en “Sample this song”.
- Nos desplazamos al cuadro de edición de la letra “Lyrics”, lo activamos y pegamos la letra que hemos copiado previamente ya sea desde el editor, o la que habíamos escrito nosotros.
- En el cuadro de edición del estilo, ponemos lo mismo que en el anterior método. Es decir:
Clear spanish male voice vocals with piano solo.
Si somos mujer, ponemos female en vez de male. Y podemos especificar el idioma, o incluso si queremos que tenga cierto acento, por si la aplicación no lo capta bien.
Se trata de conseguir una canción con solo un instrumento, pues luego hay que aislar la pista vocal, y de esa forma quedará mejor. Aquí, a diferencia de en el anterior método, nuestra voz aparecerá en todos los intentos y prácticamente al principio de las canciones.
- Antes de crear la canción hay que ir al “More Options” que hay encima del cuadro de edición para ingresar un título a la canción, desplegarlo, y poner los deslizables de las rarezas Weirdness en cero, el de Style Influence en 50, y el de Audio Influence en 100. Todo esto es para que la voz resultante sea lo más fiel posible a la del audio original. No obstante, podéis ir probando distintos porcentajes para comprobar los resultados.
- Le ponemos un título e iniciamos la creación pulsando en “Create song”. Hemos de crear varias, hasta conseguir una que nos guste, en la que nuestra voz se nos parezca. A la hora de crear más canciones con ese sample, no hay que volver a cargar su audio, permanece ya ahí, por lo que podemos ir creando canción tras canción hasta obtener la que nos guste.
- Cuando obtengamos una canción que nos guste especialmente, la pausamos y pulsamos el “More menu contents” que hay al final de la página. En el desplegable seleccionamos “Get extends”, para separar la pista vocal y la instrumental.
- Seleccionamos la opción que cuesta 10 créditos con la que se extraen los extends instrumental y vocal. Luego presionamos la letra “T” para ir al principio de la tabla y presionamos el botón “4 new clips hidden by current filters”.
- Reproducimos los extends vocales para ver cuál suena mejor. Pausamos el que más nos gusta y nos vamos al final de la página para pulsar el botón “More menu contents”. Luego desplegamos el submenú “Create” y finalmente pulsamos en “Make person”.
- En la pantalla de la persona le ponemos un título. En cuanto a la descripción, mi consejo es que de momento no la usemos. Al menos hasta que comprobemos qué tal se comporta nuestra voz. Luego desmarcamos la casilla que hace que sea pública y finalmente, pulsamos en “Save”.
Canciones de muestra con voces clonadas
A continuación tenéis varias muestras de lo que se puede hacer con esta nueva funcionalidad de Suno. Son cinco canciones en las que cantamos tres personas de las que conocéis sobradamente nuestras voces: Ricardo Abad, Enrique Varela y un servidor, Jaime franco. El hecho de que conozcáis nuestras voces os ayudará a valorar la eficacia de esta herramienta a la hora de clonar las voces. Hay un poco de todo, para que podáis comprobar su tremendo potencial y los resultados.
Canción “Sixteen Tons”. Por Ricardo Abad.
Canción “Kansas City Fusion”. Por Ricardo Abad.
Canción “Mrs. Otis Regrets”. Por enrique Varela.
Canción “Bienvenido y bienvenida a SucDePoma”. Por Jaime Franco.
Canción “De pequeñito quería ser cantante”. Por Jaime franco.
Agradecimientos
A Ricardo Abad, por haberme descubierto esta nueva funcionalidad de suno, pues hacía algún tiempo que no creaba canciones y la desconocía. Además, nos ha compartido un par de canciones estupendas en las que su impresionante voz queda genial.
Gracias también a Enrique Varela, con el que Ricardo y yo estamos colaborando en la elaboración de una guía con el proceso descrito en este artículo y que se compartirá en breve. Sus aportes han sido realmente valiosos e interesantes. Él también nos ha compartido una hermosa canción en la que su voz queda genial.
Enlace de interés
Enlace a la página de suno AI.
Autor, Jaime Franco
