Servicio Social

Desarrollo de Tecnologías del Habla

Este programa de servicio social tiene el nombre oficial de "Desarrollo de tecnologías del habla" y puedes comprobar su validez y su vigencia directamente en la página del SIASS de la UNAM.

Actualmente, el programa está dado de alta para las carreras de: Ingeniería en Computación, Ingeniería Eléctrica-Electrónica, Ingenería en Telecomunicaciones y Licenciatura en Lengua y Literaturas Hipánicas; todas dentro de la UNAM y su sistema incorporado.

En este programa nos dedicamos a crear herramientas de hardware y software que contribuyan al desarrollo de las tecnologías del habla en español en México y en el mundo.

Si estás interesado en participar, el primer paso es contactarme por medio de un correo electrónico; y si ya lo hiciste, te dejo toda la información que necesitas desde el principio hasta el final del servicio.

Características Generales:
- Requisítos de ingreso si eres de la Factuldad de Ingeniería: Necesitas al menos el 35% de créditos.
- Requisítos de ingreso si eres de la Facultad de Filosofía y Letras: Necesitas al menos el 70% de créditos.
- Duración: Siempre se busca que hagas tu servicio en 6 meses, lo cual es lo mínimo posible dada la legislación actual.
- Becas: Por desgracia este programa no está remunerado en ninguna forma.
- Ventajas: Lo que ha hecho popular a este programa es su enorme flexibilidad de horario. Muchos de mis estudiantes que trabajan aprovechan esta característica para liberar su servicio, sin tener que dejar su empleo.
- Actividades: Las actividades a realizar en el programa varían dependiendo de tu carrera. Aquí puedes consultarlas todas.
- Actualmente: El trabajo que realizamos es muy diverso y varía por muchos motivos, sin embargo, en esta temporada nos estamos enfocando en la creación de corpus orales para uso en reconocimiento automático de voz, así que las actividades más importantes por ahora son: cortar y transcribir audio. No obstante, si tú tienes alguna propuesta que esté de acuerdo a lo que hacemos en este programa, serás bienvenido para llevarla a cabo.

¿Cómo darse de alta?
Los documentos que te piden para darte de alta pueden variar dependiendo de la facultad en la que estudies, sin embargo, de manera general siempre te piden al menos dos cosas:

- Una solicitud de inicio: Se trata de un formato que debes llenar con datos tuyos y datos del programa que yo te proporciono aquí.
- Una carta de inicio: Esta carta no la puedes hacer tú, entre otras cosas porque se imprime en hoja membretada. Yo la tramito y te la doy en persona. Debes tener cuidado con esta carta porque tiene una vigencia de 10 días, así que si la carta vence antes de que hayas hecho tu trámite de alta, quedas automáticamente fuera del servicio.

Reportes Bimestrales
Si eres de la Facultad de Ingeniería, cada dos meses debes entregar en tu correspondiente oficina de servicio social, un reporte de las actividades que llevas hasta el momento. Muchos de mis estudiantes tienen dudas de cómo hacer este reporte. Por lo tanto dejo aquí un link para descarguen dos manuales: Un manual está creado por la oficina de servicio social de la Facultad de Ingeniería, ubicada en Ciudad Universitaria (Edificio "P", planta baja).El otro manual lo escribí yo. Debes seguir los lineamientos de ambos manuales para elaborar tus reportes bimestrales.

Manuales de Reporte Bimestral

Recuerda también que los reportes bimestrales te los firmo yo. Eso significa que independientemente del horario que tengas, debes planificar con al menos una semana de anticipación, verme en cualquiera de mis horarios para que te firme el reporte. Estos horarios te los proporciono después de que me contactas. En el siguiente link podrás consultar las fechas en las que debes entregar tus reportes con sólo ingresar tu número de cuenta.

Fechas de entrega de reportes

Si eres de la Facultad de Filosofía y Letras, no te piden reportes bimestrales, pero si un reporte al final de tu servicio. Debes buscar en tu facultad los lineamientos de este reporte, pero al parecer debe ser muy conciso y de unas pocas cuartillas.

Firma de los Reportes Bimestrales
A partir del año 2020 y hasta nuevo aviso, los reportes serán firmados por el Dr. Iván Meza en su oficina ubicada en el cuarto piso del IIMAS en un horario de lunes a viernes preferentemente de 9 a 15 horas. De 15 a 18 horas se firma pero hay menos garantía de que se encuentre disponible el doctor. También se pueden dejar los reportes para firma con las secretarias. El correo del doctor Iván es ivanvladimir@turing.iimas.unam.mx

Clave del programa
La clave del programa se renueva año con año. Dependiendo el año en el que inicies tu servicio será la calve que te toque. Esa clave la encontrarás en tu carta de inicio y deberás ponerla en todos tus reportes bimestrales aunque transcurra un año distinto al año en que ingresaste al servicio.

- Clave del año 2020: 2020-12/81-896
- Clave del año 2019: 2019-12/81-787
- Clave del año 2018: 2018-12/81-1574
- Clave del año 2017: 2017-12/81-643
- Clave del año 2016: 2016-12/81-3740
- Clave del año 2014: 2014-12/81-4053
- Clave del año 2013: 2013-12/81-3200

Descargar paquete de trabajo
Una vez que ya estés dado de alta en el programa, yo te daré un link para que descargues tu paquete de trabajo, sin embargo, hay algo que debes saber. El trabajo que se asigna por medio de un link reside en una nube privada llamada MyCloud, es decir, que no está ni en Dropbox, ni en Mediafire, ni en Mega, etc.

El problema que actualmente tenemos con está tecnología es que el ancho de banda está limitado a 3 megas independientemente de la velocidad de descarga que tú tengas en casa. Por esta razón se te pide que descargues tu paquete de trabajo lo más pronto posible y que tengas paciencia si es que notas que la descarga es lenta. Quizá hasta es bueno que utilices un administrador de descargas como DAP, uGet o JDowloader. Eso lo dejo a tu criterio.

De manera partícular, si te toca cortar audio, recibirás un link a una carpeta llena de archivos MP3 que deberás cortar. Por otro lado, si te toca transcribir, recibiras un link a una carpeta llena de archivos comprimidos con RAR. En este caso deberás descargarlos todos, y luego descomprimir el primero de ellos para que de manera automática se descompriman todos.

Si te toca alguna otra actividad yo te diré lo que procede llegado el momento.

Manuales para cortar y transcribir audio
Descarga el manual correspondiente si es que te tocó alguna de estas dos actividades. Si te tocaron las dos actividades, descarga ambos manuales, los necesitarás.

- Manual para cortar audio
- Manual para transcribir audio
- Manual para extracción de hablantes
-
Manual para segmentación fina de audio

Carta de término del servicio
Al final de tu servicio social, después de que has terminado todo el trabajo que te fue asignado, debes solicitarme una carta de término, que como la carta de inicio, no la puedes elaborar tú y viene también en hoja membretada. Esta carta puede tardar hasta dos semanas en salir, pero ya es el último documento que necesitas de mi. Luego de eso ya puedes tramitar la liberación de tu servicio.

Ya podrás ir comprobando que soy un poco permisivo en cuanto a la firma de los reportes bimestrales. Es decir, que si has avanzado poco en tu trabajo, pero tienes razones justificadas, te firmo sin muchos problemas. Por desgracia esto no pasa de ninguna manera con la carta de término. Es decir, que si aún no acabas el trabajo completo, no te daré la carta de ninguna manera.

¿Qué pasa si no acabo el trabajo en 6 meses?
No acabar a tiempo es una situación que no beneficia a nadie porque te atrasa tanto a ti como a mi de nuestros objetivos. Sin embargo, si por alguna razón no has podido terminar con el trabajo que te asigné, puedes tomarte un par de meses más. Si eres de Ingeniería, eso sólo significa que deberás entregar un cuarto reporte bimestral, así que no tengas miedo de que se anule tu servicio si no acabas exactamente en seis meses.

Logros del programa
Entre los logros más importantes del programa "Desarrollo de Tecnologías del Habla" se encuentran:

- LibriVox Spanish, publicado en el Linguistic Data Consortium en 2020
- CIEMPIESS-PNPD, publicado en la Conferencia Opencor 2019
- CIEMPIESS Spanish Models (581 hours), publicado en 2019 en SourceForge; un website manejado por el equipo de CMU Sphinx
- CIEMPIESS Experimentation Package, paquete de 3 corpus publicado en el Linguistic Data Consortium en 2019
- TEDx Spanish Corpus, publicado en Open Speech and Language Resources en 2019
- Corpus CIEMPIESS BALANCE, publicado en el Linguistic Data Consortium en 2018
- Corpus CIEMPIESS LIGHT, publicado en el Linguistic Data Consortium en 2017
- Corpus CHM-150, publicado en el Linguistic Data Consortium en 2016
- Corpus CIEMPIESS, publicado en el Linguistic Data Consortium en 2015

Videos Explicativos
En esta sección se muestran algunos videos explicativos que pueden serte útiles para conocer los diferentes procesos por los que pasarás si es que te das de alta en el programa.

NOTA: Los videos ya están un poco desactualizados, sin embargo, la información correcta que debes poner en tus formularios se encuentra en los instructivos que encuentras en esta misma página.

- VIDEO: ¿Cómo darse de alta en el servicio?
- VIDEO: Reportes Bimestrales Explicados