0 votos

¿Puede el Asistente de Google interactuar con las aplicaciones mientras están abiertas?

Me gustaría saber si el Asistente de Google puede interactuar con las apps mientras están abiertas, y si podríais ser tan amables de proporcionarme desde ejemplos.

A continuación, la justificación de mi pregunta:

Me preguntaba si Android admite hacer que el Asistente de Google interactúe con las aplicaciones mientras están abiertas. Sé que el Asistente de Google interactúa con aplicaciones que puede abrir llamándolas con parámetros. Por ejemplo, si le digo "llamar a Joe en WhatsApp", abre WhatsApp e inmediatamente WhatsApp llama a Joe. Sin embargo, mientras WhatsApp está abierto, puedo abrir Google Assistant para que se superponga, pero entonces no puedo decirle, después de que la llamada haya sido contestada, "cambiar la llamada a vídeo". Esto sería útil.

Lo que me gustaría saber, es si esta funcionalidad está disponible en la API de Google Assistant, y, si es así, por qué WhatsApp no ha implementado la interfaz. Si no es así, podría ser bastante útil, porque así una persona ciega podría hacer fácilmente una llamada en el teléfono de alguien, incluso de otra persona, que se encontrara en la casa, y si un niño al lado de la persona ciega quisiera llamar a su madre y cambiar a vídeo después de la llamada y el niño fuera demasiado pequeño, entonces la persona ciega, o la persona que accidentalmente perdiera su visión temporalmente debido a un accidente, estado de salud, u otro, podría hacerlo fácilmente. Entonces la madre podría intervenir y hacer lo necesario para ofrecer su presencia y, si fuera necesario, su ayuda. Creo que esta sería una importante función de accesibilidad que Google y WhatsApp podrían implementar y añadir soporte conjuntamente. El teléfono que la persona ciega utiliza normalmente con TalkBack podría romperse o quedarse sin batería. O puede ser que otro adulto de la casa que esté a cargo se desmaye y la persona ciega se dé cuenta y necesite tomar el relevo y necesite usar el teléfono de la otra persona tan entrenada y tan rápido como sea posible, y no quiera tener que pasar por la activación de TalkBack que puede no haber sido configurado en el otro teléfono o cuya locución puede confundir al niño en cuestión, haciéndole pensar que el teléfono está haciendo cosas que no quiere que haga el teléfono, lo que podría hacer que el niño le arrebatara el teléfono a la persona ciega y se quedara indefenso, sin poder hacer la llamada o lo que necesita hacer en el teléfono.

Me pregunto si Google implementará en un futuro próximo la posibilidad de que los usuarios interactúen con las apps a través de Google Assistant mientras esas apps están abiertas, en lugar de limitarse a utilizar Google Assistant para abrir esas apps.

Otras apps también podrían beneficiarse de interactuar con el Asistente de Google de esta manera de innumerables maneras. Por ejemplo, una aplicación de música podría permitir al usuario cambiar la música reproducida por el asistente. Una aplicación de cámara podría permitir al usuario tomar una foto simplemente diciéndoselo al asistente después de abrirla. YouTube podría reproducir los dibujos animados que el asistente le dijera después de que el usuario abriera YouTube desde el asistente. Todas estas son funciones perfectamente razonables y extremadamente útiles que suponen mejoras significativas desde el punto de vista de la usabilidad para un usuario ciego que tiene que lidiar con un niño impaciente que quiere ver cosas en el teléfono y no puede escribir por ser demasiado pequeño mientras el otro padre está fuera de casa trabajando.

Gracias.

1 votos

Tienes que dirigir esta pregunta a Google (y a Meta, en relación con WA). Aquí sólo podemos especular, y la especulación no es apropiada para un sitio de preguntas y respuestas.

0 votos

Gracias. ¿Qué es WA? Me he puesto en contacto con Google y con WhatsApp. Mientras tanto, también he actualizado mi post.

0 votos

"¿Qué es WA?" => has contactado con ellos, junto a Google :) // Gracias por tu edición, parece que está en el tema ahora así que lo reabro.

1voto

Morrison Chang Puntos 286

¿Puede el Asistente de Google interactuar con las aplicaciones mientras están abiertas?

Sí y no dependiendo de lo que entiendas por Google Assistant y la app

El Asistente de Google cubre una serie de características, pero para los fines de esta respuesta cubrirá dos conjuntos específicos, con nombres desafortunadamente similares:

  • Acciones de Google - Servicios de voz basados en la nube escritas por desarrolladores de terceros, similares a las Skills de Amazon Alexa, en las que tienes conversaciones de voz de trayectoria conocida con una 'app' en la nube. Aunque su uso se promueve con los dispositivos de altavoces interactivos para el hogar, puedes utilizarlos en dispositivos Android. Aparte de la propia aplicación de Google, no hay ninguna aplicación de terceros para Android, pero probablemente se utilice el mismo servicio de backend para esa aplicación de terceros. Hay que tener en cuenta que una vez que se está en la "aplicación de voz" esa aplicación está utilizando la infraestructura de voz de Google para transformar la voz en texto, e incluso entonces sólo un número limitado de sinónimos que luego es utilizado por la "aplicación de voz".

  • Google App Actions / App Shortcuts - Un conjunto definido de Intentos de Android que se envían a una aplicación Android de apoyo. Tenga en cuenta que los intentos de Android suelen ser para una acción imperativa que la aplicación manejará por completo.

Ver: https://developer.Android.com/guide/topics/ui/shortcuts#shortcut-capabilities

Una vez que se dispara la intención de Android, la aplicación receptora pasa al frente e históricamente la aplicación en primer plano tiene prioridad, excepto para la reproducción de medios, las notificaciones o las llamadas entrantes. Solo con Android 10 y en adelante es posible admitir oficialmente entrada de micrófono compartida lo que, por supuesto, conlleva sus propios problemas de privacidad/seguridad.

TalkBack es una aplicación de accesibilidad de Google separada del Asistente de Google que permite la navegación asistida por la vista/la entrada del usuario.

¿Cómo funciona TalkBack?

Cuando se lanzó Android, se admitía la navegación con el D-pad y el concepto de enfoque para cada elemento visual individual utilizado por un desarrollador de aplicaciones típico, sin incluir los juegos. La adición de metadatos adicionales sobre cada campo visual no suele requerir un cambio importante de código, véase Principios de accesibilidad para desarrolladores de Android . Utilizando las APIs de accesibilidad de Android es como TalkBack para proporcionar la navegación asistida por la vista / entrada del usuario.

¿No puedo hablar con la aplicación de Android de terceros para que haga las cosas de forma natural?

Lo que describes requiere una mayor integración con TalkBack. Pero TalkBack no es necesariamente la única aplicación de apoyo a la accesibilidad disponible. Cualquier API que utilice debería existir en el framework de Android. También es posible que la propia aplicación Android de terceros integre funciones de voz a texto.

¿Por qué la aplicación de voz de terceros, o Google Action, suena más natural/comprensible que TalkBack?

Estos servicios se diseñan primero con la voz durante el desarrollo y utilizan el lenguaje de marcado de síntesis de voz (SSML) para añadir la prosodia necesaria para que la salida suene más natural.

Android tiene su propia API llamada TTSSpan para añadir algunos elementos de prosodia a la producción hablada. Sin embargo, no es compatible con SSML directamente: ¿Soporte SSML en Android TTS? lo que supone un mayor esfuerzo por parte de los desarrolladores que sí quieren dar soporte a una salida de voz más natural.

¿Qué significa eso?

Si un usuario dice "añadir 5 al campo numérico", el contexto es importante para saber qué hace "añadir 5" y a qué "campo numérico" se refiere. Las aplicaciones de voz primero estarían diseñadas para responder con "qué campo numérico, x o y" o reiniciar la conversación para que el usuario y la aplicación estén sincronizados. Las aplicaciones de Android están diseñadas principalmente para ser visuales con pistas para que la entrada se ajuste a las expectativas (letras, números, longitud, etc.) con la accesibilidad o la voz como una característica adicional pero no principal.

TalkBack o cualquier aplicación de accesibilidad de terceros sólo tiene el conocimiento limitado expresado por cualquier etiqueta de accesibilidad para los campos que están en esa pantalla y no tiene conocimiento de cualquier otra pantalla. No existe ninguna API de Android para que un desarrollador de aplicaciones Android pueda decir a la aplicación de accesibilidad "si el usuario dice xyz haz foobar".

Entonces, ¿qué pasa con la integración de voz a texto directamente en la aplicación de Android

La conversión de voz a texto es actualmente un servicio de pago para aplicaciones de terceros y se realiza en la nube. Mientras que en el dispositivo es posible la conversión de voz a texto, los desarrolladores de aplicaciones pueden depender simplemente del teclado personalizado (GBoard, teclado OEM, otros) para manejar ese aspecto. Por ejemplo, el campo de búsqueda en la aplicación de YouTube para Android, al tocar el icono del micrófono, permite hablar el tema de búsqueda. La aplicación de Facebook para Android no tiene ese modo en la aplicación y depende de la aplicación de teclado para alimentar el texto. Hay que tener en cuenta que, hasta hace poco, el reconocimiento de voz de buena calidad requería enviar la voz a la nube para su análisis.

Pero si en Android 10 y superior ahora permite el acceso al micrófono compartido entonces es posible una mayor integración de funciones.

Sí, pero dependería del desarrollador de la aplicación de accesibilidad (Google u otra parte) y de los cientos de miles de desarrolladores de aplicaciones de terceros para soportar cualquier API, y que yo sepa no hay ninguna API para eso en el marco de Android.

0voto

Energetic Team Puntos 1

El Asistente de Google puede abrir cierto tipo de apps, sobre todo las que están directamente relacionadas con como por ejemplo: YouTube Music, Mapas y Calendario, también Mensajes y Teléfono. Sin embargo, cuando se trata de hacer juegos, puede no responder de la misma manera.

Depende del uso que le des. Varía en función de la pregunta que se haga. Por lo general, hay que ser muy específico, de lo contrario, no responderá de la manera que pretendes que lo haga. Es decir: probablemente no actuará bien y acabará dándote algo completamente.

Por eso, sé lo más específico posible al hacer la pregunta o dar una respuesta a cualquier asistente, ya sea Google/Bixby/Cortana/Alexa/Siri, etc.

1 votos

Hablas de abrir aplicaciones. La pregunta se refiere al envío de comandos a aplicaciones ya abiertas. Hay un solapamiento, pero no siempre es lo mismo.

PreguntAndroid.com

PreguntAndroid es una comunidad de usuarios de Android en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X