Básicamente, el problema con esto es que tu teléfono no puede distinguir entre lo que deseas decir y transmitir al otro extremo de la conversación, y las palabras que deseas que sean comandos para el teléfono. ¿Qué pasa si llamas a un sistema automatizado que dice "Diga 'uno' para X. Diga 'dos' para Y."? Cuando dices 'uno' o 'dos', no hay forma (sin una IA muy avanzada) para que el teléfono decida si pretendías transmitir ese discurso (por ejemplo, "dos") o si pretendías que fuera un comando para que el teléfono marque ('2').
Podrías tener posiblemente una aplicación de marcación personalizada en la que, si presionas un botón en tu teléfono, deja de transmitir tu voz y acepta comandos, y al presionar nuevamente deja de aceptar comandos y reanuda la transmisión de tu voz. Apostaría mucho dinero a que nadie ha hecho una marcación personalizada de ese tipo.
Por supuesto, hay muchos teléfonos en los que puedes ingresar "pausas" en el marcador, seguido de opciones de menú. Por ejemplo, 555-555-5555-PAUSA-PAUSA-PAUSA-2-PAUSA-1 hará lo siguiente:
- Marcará 555-555-5555
- Esperará a que se conecte la llamada
- Pulsará '2' (para una opción de menú)
- Esperará al siguiente menú
- Pulsará '1' (para una opción de menú)
Esto podría servir para tus necesidades si conoces la disposición del menú, pero de lo contrario creo que estás atrapado (a menos que quieras usar auriculares como sugiere Lie Ryan).