Hola y bienvenidos a una nueva publicación en donde en esta ocasión vamos a abordar un poco mas acerca del proyecto <<Majel>>, el nombre clave que le hemos dado al desarrollo de nuestra tecnología de voz basada en algoritmos y modelos de inteligencia artificial. Antes de llegar al platillo principal, me gustaría poner un poco de contexto y antecedentes que sentaron las bases para comenzar a poner manos a la obra en este proyecto, te cuento.
LA INSPIRACION
«Toda tecnología que está avanzada a su tiempo, se le considera magia.» Vivimos una época extraordinaria. Todos los avances que la ciencia y el raciocinio humano han generado nos ha llevado a quienes vivimos este momento del tiempo a estar, no solo en la cúspide de la civilización, sino en disfrutar de los avances que nos han traído como resultado de la tecnología que hemos creado permitiéndonos vivir cómodamente y hacer nuestras actividades de forma mas rápida, productiva y amigable. Pero para llegar a esto debe estar presente la más importante de las condiciones: la imaginación. Para quienes estamos trabajando en este proyecto, nuestra fuente de inspiración ha sido la ciencia ficción y que gracias a estas fantásticas ideas es que nosotros nos hemos imaginado un mundo donde las personas puedan interactuar con sistemas, computadoras, servidores y todo tipo de dispositivos electrónicos a través de la voz.
EL RETO
Suena genial cuando hablamos sobre ciencia ficción porque bajo ese mundo las cosas ya están hechas; sin embargo, el verdadero reto está en crear desde cero algo que no existe. Cuando comenzamos a desarrollar este proyecto, nos dimos cuenta sobre muchos obstáculos que vencer. De inicio nos preguntamos sobre como lograr un entendimiento por parte de las computadoras en relación a las palabras y el contexto de las palabras dichas por un usuario para que entienda cuando es una instrucción o cuando es parte de una conversación. Tratar de armar primero el rompecabezas -que no existía- para después armarlo parecía una locura. Sin embargo, hemos podido avanzar poco a poco hasta lograr una base sólida, un punto de partida para que de ahí pudiésemos comenzar a construir cosas mas complejas y que pueda integrarse con tecnologías de hardware y software de terceros para ser usados mediante la voz sin necesidad de periféricos visuales o táctiles.
LA INTELIGENCIA ARTIFICIAL
No voy a entrar en detalle de lo que es la IA pero si diré que estas ideas, todas ellas matemáticas puras aplicadas en su máxima expresión, nos han permitido a nosotros como a muchas otras empresas, desarrolladores de software, ingenieros y entidades de investigación en crear aplicaciones basadas en algoritmos que puedan encontrar patrones. La IA es ese ingrediente necesario para hacer que la «magia» funcione pero cuya curva de aprendizaje no es tan simple como a muchos nos hubiera gustado.
LA INTERFAZ DE VOZ: MAJEL
Como mencioné en un principio, Majel es el nombre que le hemos dado a nuestro proyecto y desarrollo de software. Con este proyecto buscamos que las personas, como usuarios finales, puedan ejecutar y llevar a cabo tareas diferentes con solo indicar verbalmente la petición a sus equipos de cómputo pero con el ingrediente de usar la voz de forma paralela a lo que estén realizando en un momento dado, sin tener que distraerse. Es aquí donde empieza nuestra visión. Queremos llevar la forma en como actualmente hacemos las cosas en nuestros equipos de cómputo de forma diferente y con ello buscamos mejorar la productividad llevándola a otro nivel. Déjenme darles un contexto y un ejemplo de esto:
Situación actual: para abrir un programa -el que sea- haces uso de periféricos como el ratón y teclado ¿cierto?, nada nuevo detrás del sol. Las aplicaciones se abren en tu pantalla -y puede que se abra en la pantalla principal o secundaria, no está en tu poder decidir en cual monitor debe abrirse tu programa- y comienzas a trabajar o realizar tus actividades. Si deseas consultar cualquier información, requieres hacerlo de forma manual y con ello interrumpir tu flujo de trabajo, ideas y actividades y eso, aunque parezca increíble, tiene un impacto en la concentración de las personas.
Situación próxima futura: el usuario solo tiene que presionar una combinación de teclas para activar la interfaz de voz e indicar su petición. La computadora entiende y ejecuta esa instrucción, incluso es posible decirle en que pantalla desea que se abra un programa especifico (navegador, procesador de texto, hoja de cálculo, abrir un sitio web especifico en un navegador de tu preferencia, saber el pronóstico del clima, imprimir documentos, actualizar hardware o software conectado al sistema, actualizar el sistema operativo, entre otros). Lo mas importante es que siempre, siempre, siempre, tu micrófono estará cerrado preservando la privacidad y seguridad de nuestros clientes(*).
(*) Toma nota que liberaremos un micrófono diseñado, fabricado y probado para ser compatible con nuestra interfaz, te invitamos a que si estás interesado te suscribas a nuestra lista de espera para que seas de los primeros en contar con el dispositivo de entrada de audio certificado con nuestra IVU.
Suena muy sencillo y simple esto que te cuento, pero es mas complejo de lo que parece ser. En la era donde la inteligencia artificial esta rompiendo fronteras, todo es posible. Nuestro objetivo es poder ofrecer a todos nuestros futuros usuarios una herramienta que les permita hacer varias cosas sin distraerse, obtener información como si de hablar con un experto se tratase, dar valor de lo que hacemos con el uso normal diario de nuestras voces. En próximas entregas hablaremos sobre nuestro modelo de negocio ya que gracias a nuestro enrolamiento al Programa de Google Cloud Startups hemos podido tener grandes avances pudiendo liberar una versión de prueba para ingenieros seleccionados y podamos obtener de ellos retroalimentación de lo hasta ahora hecho.
Te agradezco enormemente tu atención y te invito a que compartas esta publicación en tus redes sociales. Si deseas saber mas de nuestro proyecto, si eres un fabricante de hardware o software o eres una persona interesada en probar nuestra tecnología de voz te invito a hacer contacto aquí o buscarme en la red social de Linkedin para hablar de negocios. Nos vemos en una próxima publicación.
CC

