Mail To Web
UK FlagEnglish | UK FlagCastellano | UK FlagCatalá
Descripción | Descargar | Instrucciones | Contribuya | Contacto

Descripción

MailToWeb es una herramienta para almacenar y mantener grandes volumenes de correo electrónico. Mailtoweb procesa carpetas de correo en formato mbox, como las producidas por Netscape y Mozilla (*), y produce un conjunto de documentos en formato HTML, relacionados por hipervínculos, desde los cuales es fácil acceder a la información utilizando diferentes criterios de búsqueda.

MailToWeb es también una herramientas de investigación para estudiar mecanismos eficientes de recuperación de mensajes basados en información extraída de las carpetas de correo.

(*) Si utiliza como procesador de correos Microsoft Outlook, puede usar Netscape para importar sus mensajes desde MO y generar los archivos correspondientes en formato mbox.

Descargar e instalar

Requerimientos de sistema:
Descargue el fichero:
Instrucciones para ejecutar (Windows):
  1. Extraiga los archivos con Winzip o Unzip.
  2. Haga doble click en 'MailToWeb.bat'
Instrucciones para ejecutar (Linux):
  1. Descomprima el fichero: 'tar -zxvf MailToWeb-Linux-xxx.tar.gz'
  2. Ejecute './MailToWeb.sh'

Instrucciones y capturas de pantalla

La ventana principal es como la que se ilustra a continuación:

Main Window

 Elija "File ... Convert ...", y una ventana de selección aparece:

Window to choose input and output directory

La información que debe introducir es la siguiente:
Desde este punto el proceso no requiere ninguna asistencia del usuario. Automáticamente irá de la etapa de "Leer e-mail" a la etapa de "Analizar e-mail". Esto puede tomar algún tiempo: incluso 1-2 horas para un mailbox grande (600Mb).

Screenshot of the reading stage Screenshot of analyzing e-mail

Cuando el proceso termine, abra el fichero HTML creado en su browser favorito. Debería verse de esta manera:

Screenshot of message archive

El sistema de búsqueda sólo está disponible con el plug-in de Java instalado. Ahora puede ingresar palabras para buscar, o hacer click en  "Person Index" (índice de personas), "Person Graph" (gráfico de personas) o "Calendar" (calendario).

Person Index (click para acercar)
Person Graph (click para acercar)
Calendar (click para acercar)
Person Index
Person Graph
Calendar

Investigación y contribución

Este programa es parte de un proyecto de investigación apuntado a identificar características comunes de las casillas de correo, para ello, cada vez que se aplica sobre un directorio de correos, se genera un archivo "data/public.txt" el cual contiene información numérica para ser utilizada en análisis estadísticos. En particular, para cada mensaje de la casilla de correos, se registra una serie de líneas de la forma <etiqueta>::<número> donde el significado de cada etiqueta es el siguiente: (? significa un número cualquiera)

NU::? Número que identifica al mensaje
FO::? Número que identifica a la casilla de correo
SE::? Número que identifica al que lo envió
TO::? Número que identifica al que lo recibió (puede haber varios)
CC::? Número que identifica al que recibió copia (puede haber varios)
SI::? Número que identifica el tema del mensaje
DA::? Hora de envío expresada en milisegundos transcurridos desde el 1/1/1970
SZ::? Tamaño del mensaje

Ud, puede contribuir con este proyecto enviando el fichero 'data/public.txt' creado bajo el sitio web generado, vía e-mail,  a catedratelefonica@fundacio.upf.es

Recuerde, e
ste fichero contiene datos numéricos sobre su casilla de correo. Si usted lo desea, puede revisar este fichero usando un procesador de textos o un editor de texto plano.

Contacte a los autores

Créditos:
Si necesita contactarnos respecto a este proyecto, utilice la dirección de e-mail: catedratelefonica@fundacio.upf.es