Conjuntos de datos

EDRM ofrece los siguientes conjuntos de datos que se enumeran a continuación.

Descargar Conjunto de datos de formato de archivo EDRM

Contenido (17,6 MB):

  • Readme.txt
  • EDRM_Data-Set_File-Formats_1-0_Manifest.xls
  • Carpeta de "conjunto de datos" que contiene 158 carpetas con 381 archivos

los Conjunto de datos de formato de archivo EDRM consta de 381 archivos que cubren 200 formatos de archivo.

Los tipos de archivos incluyen:

Adobe Photoshop Mac WordPerfect PFS: Plan
Ami Draw Mac funciona Publicar guión
Corel Draw MacPaint Base de datos de preguntas y respuestas
Presentaciones de Corel MacWrite Escritura de preguntas y respuestas
dBASE Diseñador Micrografax Quattro Pro
Primera elección DB, SS, WP acceso Microsoft Reflejo
Lanza libre Microsoft Excel Hoja de cálculo inteligente
Harvard Graphics Microsoft PowerPoint ShartWare II
Archivo de gemas Proyecto de Microsoft StarOffice Calc
Imagen de gema Microsoft PST StarOffice Impress
IBM DCA / RFT Microsoft Visio Escritor de StarOffice
IBM DisplayWrite Metarchivo de Microsoft Win SuperCalc
Formato de datos de gráficos de IBM Microsoft Word Sinfonía
Intercambio de imágenes de IBM Microsoft Works Targa
Asistente de escritura de IBM MultiMate Palabra total
Dibujo IGES Mutipage vCard
CD de fotografías de Kodak Multiplan Volkswriter
Lotus 1-2-3 OfficeWriter VP Planificador
Manuscrito de Lotus Cepillo de pintura Wang IWP
Lotus PIC Paint Shop Pro WordPerfect
Instantánea de pantalla de Lotus Paradoja Estrella de la palabra
PowerPoint para Mac PDF XyWrite
Mac Word PerfectWorks para Windows

Descargar:

 

los Conjunto de datos de internacionalización de EDRM (18,4 MB) es una instantánea de los archivos seleccionados de la lista de distribución de distribución de Ubuntu que cubre 23 idiomas en 724 MB de correo electrónico.

Los idiomas son:

Arábica catalán chino
danés holandés Inglés
finlandés francés alemán
griego hebreo húngaro
italiano japonés coreano
noruego polaco portugués
rumano ruso Español
sueco Tamil turco

EDRM ofrece un "Micro Dataset" diseñado para pruebas de eDiscovery y validación de procesos. Los proveedores de software, las organizaciones de apoyo en litigios, los bufetes de abogados y otros pueden utilizar estos conjuntos más pequeños para calificar el soporte, probar la velocidad y la precisión en la indexación y la búsqueda, y realizar ejercicios de análisis de orientación más forense a lo largo del flujo de trabajo de eDiscovery.

La comunidad EDRM agradece a estos miembros por su activa participación en esta importante iniciativa:

  • Eric Robi
  • Michael Lappin
  • Chad Main
  • Henry Moreno

Conjunto de datos micro EDRM

El micro dataset de EDRM es un archivo zip de aproximadamente 136,9 MB que contiene las últimas versiones de todo, desde archivos de Microsoft Office y Adobe Acrobat hasta archivos de imagen. El grupo EDRM Dataset ha buscado en Internet y ha encontrado datos utilizables disponibles gratuitamente en universidades, sitios gubernamentales y otros lugares, una selección de los cuales se incluye en el archivo zip.

El conjunto de datos completo proviene de datos disponibles públicamente y está libre de restricciones de derechos de autor. Fue ensamblado por los Laboratorios de Investigación Forense Digital de la Universidad Tecnológica de Auckland, en colaboración con el equipo de EDRM Dataset.

El micro dataset de EDRM se valora por su gran variedad de tipos de archivos y otros desafíos característicos de ESI recopilados en casos de descubrimiento. Los archivos tienen varios niveles de corrupción y el conjunto de datos contiene un conjunto duplicado de archivos que están encriptados para respaldar los ejercicios de manejo de excepciones y las pruebas avanzadas.

La combinación de tipos de archivos de EDRM Micro Dataset incluye:

  • Una variedad de archivos .csv
  • Sitios web y páginas web
  • Archivos de Adobe Acrobat
  • Archivos gráficos y fotografías
  • Datos del censo público
  • Archivos de Microsoft Office
  • Archivos de sonido
  • 4 buzones de correo electrónico con correspondencia, hilos y archivos adjuntos compartidos
  • Varios archivos Encase .e01 que contienen datos de un teléfono y otra fuente de datos

El equipo de Dataset incluye:

  • Eric Robi, presidente de Elluma Discovery
  • Michael Lappin, director de Tecnología e Ingeniería de Ventas, Nuix
  • Chad Main, fundador, Percipient
  • Henry Moreno, gerente de eDiscovery, Dell Inc.
  • Brian Cusack, director, AUT Digital Forensic Research Laboratories, y profesor, ECU Security Research Center, Auckland University of Technology

Lista de verificación de EDRM ESI

Otros conjuntos de datos

El proyecto EDRM que se centra en conjuntos de datos busca conjuntos de datos muy grandes con una variedad de tipos de datos. Envíe un correo electrónico a info@edrm.net para unirse al proyecto o identificar algunos datos importantes.

es_ESSpanish
en_USEnglish es_ESSpanish
X