Descripción
MailToWeb
es una herramienta para almacenar y
mantener grandes volumenes de correo electrónico.
Mailtoweb procesa carpetas de correo en formato mbox, como las
producidas por Netscape y Mozilla (*), y produce un conjunto de
documentos en formato HTML, relacionados por hipervínculos,
desde los cuales es fácil acceder a la información
utilizando diferentes criterios de búsqueda.
MailToWeb es también una herramientas
de investigación para estudiar mecanismos eficientes de
recuperación de mensajes basados en información
extraída de las carpetas de correo.
(*) Si utiliza como procesador de correos Microsoft Outlook,
puede usar Netscape para importar sus mensajes desde MO y generar los archivos
correspondientes en formato mbox.
Descargar e instalar
Requerimientos de sistema:
- Java y Java Plug-in.
Hemos testeado este software con versión 1.4.1 y superiores.
- Sistemas operativo Linux o Windows.
- Espacio en disco igual o superior al que ocupa el correo que se va a procesar
Descargue el fichero:
Instrucciones para ejecutar (Windows):
- Extraiga los archivos con Winzip o Unzip.
- Haga doble click en 'MailToWeb.bat'
Instrucciones para ejecutar (Linux):
- Descomprima el fichero: 'tar -zxvf MailToWeb-Linux-xxx.tar.gz'
- Ejecute './MailToWeb.sh'
Instrucciones y capturas de
pantalla
La ventana principal es como la que se ilustra a continuación:
Elija "File ... Convert ...", y una ventana de selección
aparece:
La información que debe introducir es la siguiente:
- "Source e-mail folders directory".
El directorio en donde residen sus archivos de correo en formato mbox (la
casilla de correos). Puede contener subdirectorios. Archivos con otro
formato son ignorados.
- "HTML output file".
Archivo de salida para el sitio web personal generado. Se creará también un
sub-directorio "data" en el mismo lugar del archivo.
- "Save XML files to disk".
Si desea o no almacenar en el disco los archivos xml que la aplicación genera para cada mensaje (no se recomienda).
Desde este punto el proceso no requiere ninguna asistencia del usuario.
Automáticamente irá de la etapa de "Leer e-mail" a la etapa de
"Analizar e-mail". Esto puede tomar algún tiempo: incluso 1-2
horas para un mailbox grande (600Mb).
Cuando el proceso termine, abra el fichero HTML creado en su browser favorito.
Debería verse de esta manera:

El sistema de búsqueda sólo está disponible con el
plug-in de Java instalado. Ahora puede ingresar palabras para buscar, o hacer
click en "Person Index" (índice de personas), "Person
Graph" (gráfico de personas) o "Calendar" (calendario).
Person Index
(click para acercar)
|
Person Graph
(click para acercar)
|
Calendar
(click para acercar)
|

|

|

|
Investigación y contribución
Este programa es parte de un proyecto de investigación apuntado
a identificar características comunes de las casillas de correo, para
ello, cada vez que se aplica sobre un directorio de correos, se genera un
archivo "data/public.txt" el cual contiene información numérica para ser
utilizada en análisis estadísticos. En particular, para cada mensaje de la
casilla de correos, se registra una serie de líneas de la forma <etiqueta>::<número>
donde el significado de cada etiqueta es el siguiente: (? significa un número cualquiera)
| NU::? |
Número que identifica al mensaje |
| FO::? |
Número que identifica a la casilla de correo |
|
SE::? |
Número que identifica al que lo envió |
| TO::? |
Número que identifica al que lo recibió (puede haber varios) |
|
CC::? |
Número que identifica al que recibió copia (puede haber varios) |
|
SI::? |
Número que identifica el tema del mensaje |
|
DA::? |
Hora de envío expresada en milisegundos transcurridos desde el
1/1/1970 |
| SZ::? |
Tamaño del mensaje |
|
Ud,
puede contribuir con este proyecto enviando el fichero 'data/public.txt'
creado bajo el sitio web generado, vía e-mail,
a catedratelefonica@fundacio.upf.es
Recuerde, este fichero contiene datos numéricos sobre su casilla
de correo. Si usted lo desea, puede revisar este fichero usando un
procesador de textos o un editor de texto plano.
|
Contacte a los autores
Créditos:
Si necesita contactarnos respecto a este proyecto, utilice la
dirección de e-mail: catedratelefonica@fundacio.upf.es