Pensé que el modo de voz de ChatGPT era un truco: estos 7 casos de uso me hicieron cambiar de opinión

Publicado el:

spot_img
- Advertisment -spot_img

Siga ZDNET: Agréganos como fuente preferida en Google.


Conclusiones clave de ZDNET

  • Hablar con ChatGPT se siente más colaborativo que escribir.
  • Destaca por la lluvia de ideas, la preparación y la traducción.
  • Los límites de uso pueden interrumpir la productividad a mitad de sesión.

Durante el último año, tuve la oportunidad de hablar con OpenAI. La mayoría de las veces, esas conversaciones han sido sobre programación o capacidades relacionadas con la codificación, pero recientemente tuve una discusión sobre el modo de voz.

- Advertisement -[wpcode id="699"]

OpenAI quería mostrar una serie de ejemplos que puedes hacer con él. La última vez que eché un vistazo al Modo Voz, estaba evaluando sus conocimientos técnicos. La IA fabricó respuestas para proporcionar respuestas rápidas que, en ese momento, debilitaron su utilidad para mí.

Después de ese fracaso, en cierto modo ignoré la capacidad. Pero las sugerencias que hizo OpenAI sobre cómo aprovechar al máximo el modo de voz aprovechan sus puntos fuertes y me hicieron querer volver a comprobarlo. Entonces, decidí tener una conversación en Modo Voz sobre el Modo Voz.

Esa conversación resultó ser muy productiva y ahora voy a resaltar siete cosas que puedes hacer con el Modo de voz que aumentarán tu productividad. Continúe leyendo hasta el final porque hay un bono, una octava idea que en sí misma vale el precio de la entrada.

(Divulgación: Ziff Davis, la empresa matriz de ZDNET, presentó una demanda en abril de 2025 contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).

- Advertisement -[wpcode id="699"]

Usando el modo de voz

El modo de voz se ejecuta en dispositivos móviles, así como en su navegador. En dispositivos móviles, hay dos widgets ChatGPT disponibles para la pantalla de bloqueo. Un widget abre la aplicación y el otro inicia ChatGPT Voice. Si elige el widget de Voz, tendrá acceso inmediato con un toque al Modo de Voz directamente desde la pantalla de bloqueo.

La capacidad de escritorio en el navegador me pareció realmente interesante porque funciona cuando la pestaña está en segundo plano. Simplemente toque el pequeño ícono a la derecha de la barra de chat.

Entonces, por ejemplo, pude tener un mensaje de correo electrónico abierto mientras estaba en la pestaña Gmail de Chrome mientras hablaba con el modo de voz ChatGPT. Lo encontré bastante útil, especialmente porque estaba revisando el hilo de correo electrónico que tenía con OpenAI sobre este tema.

Todo lo que discutas por voz se convierte en una transcripción de ChatGPT. Eso le permite regresar, cortar y pegar la transcripción del chat en otros documentos o en su correo electrónico.

Noté que cuando usé el modo de voz para una discusión sobre productividad, la transcripción resultante fue más locuaz. Tendrás que investigar un poco más en tu transcripción para encontrar las joyas que deseas pegar en otras cosas, pero funciona.

También puede utilizar el modo de voz para dictar exclusivamente diciéndole «iniciar dictado» y «detener dictado». Eso permite que Voice Mode capture sus palabras exactas y luego las guarde en el chat.

Puedes elegir entre una variedad de voces.

- Advertisement -[wpcode id="699"]

Elegí Vale, que tiene acento británico y un aire de Mary Poppins. Si quieres otro acento británico, también está Arbor, que tiene un toque un poco más de Artful Dodger. También hay voces con acento americano más alegres o más profesionales que puedes elegir.

Leer  Chronosphere se enfrenta a Datadog con una IA que se explica por sí misma, no solo por las interrupciones

Usos del modo de voz que deberían ayudarte a empezar

OpenAI proporcionó las siguientes ideas, pero agregué una idea adicional como beneficio adicional. Tenga en cuenta que hay muchas más formas de utilizar el modo de voz como compañero de productividad, pero esta lista debería hacerle pensar.

1. Traducción instantánea mientras viajas

Una de las presunciones que utilizaba la ciencia ficción de la vieja escuela como Star Trek, Doctor Who y Farscape era que todo el mundo hablaba inglés, incluso los extraterrestres de planetas distantes. La forma en que los protagonistas se comunicaban con los extraterrestres era una especie de traductor universal, un dispositivo que convertía la palabra hablada de un idioma a otro.

Ahora, sin embargo, su teléfono puede ser un traductor universal. Simplemente abre la aplicación ChatGPT y deja que traduzca por ti. Puede indicarle que se traduzca al idioma de su elección. Luego, cuando digas algo en inglés, dirá algo que significa lo mismo en el idioma de destino. Lo que hace que esta herramienta sea tan práctica es que puede traducir al inglés lo que la otra persona dice en ese idioma.

OpenAI no enumera directamente la cantidad de idiomas ni especifica los idiomas que puede traducir. Sin embargo, como muestra este clip de Instagram, ciertamente es posible utilizar ChatGPT para comunicarse mientras se viaja.

Como puedes imaginar, encontré algunas formas contraproducentes de hacer que esta función me entretenga. Traducir al klingon conversacional parecía un desafío, y lo logró. La IA no pudo traducir al Shyriiwook, el idioma de los wookiees. Aparentemente, es demasiado gutural para que la IA lo maneje. Sin embargo, pude traducir el inglés hablado al huttés, el idioma hablado por hutts como Jabba y ampliamente comprendido en el inframundo de Star Wars.

2. Háblalo para organizar tus pensamientos.

A menudo encuentro que utilizar a otra persona como caja de resonancia puede ayudarme a organizar mis pensamientos. Resulta que también puedes usar el modo de voz de ChatGPT para hacer lo mismo.

Cuando estés en el modo de voz, puedes darle indicaciones como «Voy a divagar durante 60 segundos sobre lo que me estresa. Luego, resume lo que escuchaste y dame los siguientes 3 pasos» o «Tengo un día ocupado, ayúdame a crear una lista de tareas pendientes a partir de todo lo que estoy a punto de contarte».

Utilicé el modo de voz para hablar sobre algunas de las ideas de este artículo. Aunque finalmente me interrumpieron la conversación (más sobre eso a continuación), le pedí que repasara lo que habíamos hablado y extrajera las preguntas que le había hecho como una lista rápida. Así fue, y usé esas preguntas para desarrollar mi rápida ronda de preguntas y respuestas a continuación.

Para esta capacidad, simplemente dígale a la IA que escuche y luego hable con ella. Cuando haya terminado, o incluso a mitad del camino, pídale que lo organice, aclare o lo motive a pensar más.

3. Un compañero de pensamiento en movimiento

La técnica anterior habla de utilizar el Modo Voz de ChatGPT para estructurar información, básicamente para convertir ideas en una lista, un plan o notas concisas.

Pero puedes llevar ChatGPT en la dirección opuesta para ayudarte a generar ideas, lo que los fanáticos de las palabras de moda llaman «ideación». En este ejemplo, no sólo estás organizando tus pensamientos, sino que estás explorando para encontrar algo nuevo. Estás utilizando ChatGPT para generar pensamientos, análisis y nuevas ideas.

Utilice indicaciones como «¿Puedes explicarme esto» o «¿Puedes guiarme para descubrir nuevos enfoques?» para activar completamente esta técnica.

4. Prepárese para una entrevista o una gran reunión con práctica en vivo

Esto fue divertido. Le pedí a ChatGPT que me hiciera cinco preguntas de la entrevista, como si estuviera haciendo una audición para un puesto de gerente de producto. Cuando era un simple cachorro, era gerente de producto y luego director de marketing de producto para algunas empresas de informática y software.

Leer  El trabajo que la IA realmente debería estar haciendo, según estos profesionales.

ChatGPT me hizo una serie de preguntas. Lo que me gustó de esto fue que era interactivo. Es muy diferente responder verbalmente una pregunta de práctica en vivo que volver a su computadora, pensar en una respuesta y escribirla en párrafos.

También valoré el hecho de que ChatGPT pudiera evaluar las respuestas y darme comentarios. También puedes indicarle que te indique cuando estás divagando, que confirme cómo te va en términos de mantenerte en el tema y que te ayude a practicar cómo responder preguntas de manera concisa.

5. Asistente manos libres para las tareas cotidianas

Esto funciona bien una vez que abres y desbloqueas tu teléfono. Si viaja, cocina o hace algo con las manos, como empacar para viajar o limpiar una mesa de trabajo, puede hablar con ChatGPT, que puede grabar y responder.

El ejemplo que me viene a la mente para mi estilo de vida es hacer la lista de compras. Mi esposa y yo comemos prácticamente los mismos alimentos todas las semanas, con algunas excepciones menores. Así podríamos introducir fácilmente la lista completa de todos nuestros alimentos en ChatGPT. Luego, con el teléfono en mi bolsillo y mis AirPods en mis oídos, puedo hacer que me guíe por el refrigerador, el congelador grande y nuestros gabinetes, identificando si todavía tenemos suficiente de un artículo determinado o si necesitamos más.

Por ejemplo, podría decir: «Estoy en el congelador, ¿qué debo revisar?». Podría decir: «Déjame saber cuántas bolsas de brócoli congelado te quedan». Podría responder: «Tenemos 3». Y podría decir: «Agregaré siete bolsas a la lista».

Una vez finalizado el proceso, podría hacer que construya una lista de lo que necesitamos, que se convertiría en nuestra lista de compras muy precisa.

¿En qué tareas de manos libres podría ayudarte ChatGPT? Déjamelo saber a continuación.

6. Editor de textos en tiempo real para los mensajes que estás a punto de enviar

Me gusta redactar y enviar mis propios mensajes de correo electrónico y textos. Pero la función de dictado manos libres del modo de voz ChatGPT tiene su atractivo.

Por ejemplo, puede dictar un mensaje en modo más bien de lluvia de ideas y luego pedirle a ChatGPT que lo limpie para poder cortarlo y pegarlo en un correo electrónico. O podrías darle un mensaje como: «Voy a dictarle un mensaje de texto a mi amigo. Reescríbelo para que suene cálido y claro. No quiero sonar dramático».

Ese último mensaje fue proporcionado por OpenAI. ¿Podría haber alguna historia jugosa sobre el drama? No, no quiero saberlo. Simplemente use esta función para limpiar divagaciones y realizar algunos cortes y pegados rápidos.

7. Haz preguntas sobre imágenes en tiempo real.

Esta es una función que solo está disponible para los niveles pagos de ChatGPT. También difiere en su sabor dependiendo de si lo está usando en su escritorio en su navegador o usando la aplicación móvil.

Cuando estás en el modo de escritorio, es posible introducir una captura de pantalla o una foto y que la IA te lo informe. A menudo envío capturas de pantalla a ChatGPT. Esta fue la primera vez que lo probé en modo de voz.

Lo encontré particularmente útil con los formularios porque podía hacer una captura de pantalla del formulario, introducirlo en ChatGPT y dejar que el Modo de voz se ejecutara en una pestaña en segundo plano. Luego, con el formulario en la pestaña de primer plano, podría hablar con la IA y pedirle que me ayude con lo que se debe incluir en cada campo.

En el modo móvil, puedes usar fotos existentes que ya están en tu teléfono o tomar fotografías de ubicaciones, letreros, platos de comida, contenido de tu refrigerador o cualquier otra cosa sobre la que quieras saber más, y hacer que el Modo de Voz te ayude con los contenidos. Un gran ejemplo nos lleva de regreso a la traducción: puedes tomar una foto de un letrero que está en otro idioma y obtener una traducción de ChatGPT.

Leer  Roku acaba de hacer que la navegación por sus canales de TV en vivo gratuitos sea mucho más fácil: cómo funciona el botón "Buscar"

Bonificación: compañero de ejercicio

OpenAI no sugirió esto, pero lo probé y es genial. Puedes utilizar el modo de voz ChatGPT como compañero de ejercicio para ayudarte a realizar un seguimiento de las repeticiones, recordarte qué hacer a continuación y animarte a continuar.

Lo probé con pesas. Le dije: «Está bien, tengo diez repeticiones. ¿Qué sigue?» a lo que recibí una respuesta: «Necesitas hacer cinco ejercicios más de este ejercicio y luego cambiar a elevaciones laterales. Lo estás haciendo muy bien. Sigue así».

Normalmente no me gusta que mis IA me halaguen o me animen, pero cuando se trata de hacer ejercicio, aceptaré toda la ayuda que pueda conseguir.

El modo de voz se siente diferente

Usar el modo de voz como ayuda para la productividad es una experiencia un poco extraña. Es exactamente la misma experiencia ChatGPT que tienes al escribir texto. Pero como estás hablando, realmente se siente como una conversación.

Descubrí que había más profundidad (y más serpenteantes) en la entrada que proporcioné a la IA cuando usaba el modo de voz que cuando escribía, por lo que mis indicaciones eran sustancialmente más locuaces.

El tono de voz que utiliza la IA tiende a generar una sensación de comunicación similar a la de un colega en comparación con simplemente leer una respuesta de chat en la pantalla. El sentimiento de la conversación es mucho más conectado. No estoy seguro de si eso es bueno o malo, pero es una experiencia interesante.

Como dije en mi artículo anterior, siento que todavía estoy sacrificando precisión por la fluidez de la conversación. Pero si utiliza el modo de voz para un trabajo que se beneficia de la fluidez de la conversación, funciona sorprendentemente bien.

Hasta que no lo haga.

Límites poco claros

Estoy usando el plan ChatGPT Plus de $20 por mes. Aproximadamente 30 minutos después de mi conversación explorando el modo de voz, recibí este mensaje.

Aquí hay dos cuestiones: ¿cuánto tiempo se permite y cuál es la diferencia entre el modo de voz avanzado y estándar?

CNET tiene un explicador que describe ambos modos. Según el artículo, «En el modo estándar, la IA crea su respuesta en texto primero y luego una herramienta de voz separada lee el texto en voz alta. Si bien la voz puede sonar decente, puede parecer antinatural y a menudo retrasada. Un modelo unificado como la voz avanzada no separa la escritura y el habla».

El modo más avanzado ajusta su tono para que suene más natural. Puedes saber que estás usando el modo avanzado porque el indicador de voz es un círculo azul. El modo estándar muestra un círculo negro.

Desafortunadamente, cuando se trata de los límites que puede encontrar, las preguntas frecuentes sobre el modo de voz de OpenAI no son particularmente útiles. No creo que esté actualizado. Habla de límites para GPT-4o, pero GPT-4o se retiró a principios de este mes.

En cualquier caso, esto es lo que dice OpenAI sobre los límites:

  • Usuarios gratuitos (con sesión iniciada): La voz se ejecuta en GPT-4o mini y está limitada a una cantidad determinada de horas por día.
  • Más suscriptores: La voz comienza con GPT-4o y es casi ilimitada todos los días; después de utilizar GPT-4o minutos, continúa con GPT-4o mini.
  • Suscriptores profesionales: Uso ilimitado de voz GPT-4o, sujeto a restricciones de abuso.
  • Empresa: Uso ilimitado de voz GPT-4o, facturado según consumo de crédito.

Con mi plan Plus, choqué contra una pared aproximadamente a los 30 minutos. Como estoy probando la calidad, decidí omitir la degradación al modo Estándar.

Animo a OpenAI a actualizar sus documentos de preguntas frecuentes con los nombres de modelo correctos e información de límites más tangible y comprensible.

¿Qué pasa contigo?

¿Has probado el modo de voz de ChatGPT como herramienta de productividad o te limitas principalmente a escribir? ¿Se ve usándolo más para organizar sus pensamientos, generar ideas, preparar entrevistas en vivo, traducir o realizar tareas con manos libres?

¿Se ha topado con límites de uso? ¿Los límites de uso cambiaron la forma en que lo usas? ¿El modo de voz le parece más conversacional y útil, o menos preciso? ¿Para qué otras tareas de productividad recomienda utilizar el modo de voz? Háganos saber en los comentarios a continuación.


Puedes seguir las actualizaciones diarias de mi proyecto en las redes sociales. Asegúrate de suscribirte a mi boletín de actualización semanal y sígueme en Twitter/X en @DavidGewirtzen Facebook en Facebook.com/DavidGewirtz, en Instagram en Instagram.com/DavidGewirtz, en Bluesky en @DavidGewirtz.com y en YouTube en YouTube.com/DavidGewirtzTV.

spot_img

Relacionada

Leave a Reply

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_img