En este repositorio compartimos el conjunto de imágenes de mosquitos recopiladas por el proyecto Mosquito Alert desde 2014 para realizar tareas de clasificación de imágenes.
También pueden descargarse las carpetas con las imágenes de cada categoría por separado:
Aedes albopictus: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Aedes_albopictus
Aedes aegypti: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Aedes_aegypti
Aedes japonicus: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Aedes_japonicus
Aedes koreicus: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Aedes_koreicus
Complex japonicus/koreicus: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Japonicus_koreicus
Complex albopictus/cretinus: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Complex
Culex pipiens group: https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Culex
Other species https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Other_species
Not sure https://www.ebi.ac.uk/biostudies/files/S-BIAD249/Not_sure
Carpetas con las imágenes
Las imágenes están archivadas en carpetas individuales por año. Cada carpeta contiene dos archivos:
1. images.tar.gz.
Un archivo comprimido con el conjunto de imágenes. Cada imagen es un archivo «.png» con un nombre de archivo de número de seis dígitos (por ejemplo, 012345.png).
2. imgRef.txt.
Un archivo csv file con la información de las imágenes:
-
columna 01. ‘imgNmb’, número de la imagen (tal que el nombre del archivo de la imagen correspondiente sea str(imgNmb).zfill(6)+’.png’);
-
columna 02. ‘imgId’, identificador de la imagen interno de Mosquito Alert (para fines internos);
-
columna 03. ‘rprtId’, identificador del informe de Mosquito Alert (para fines internos);
-
columna 04. ‘imgDate’, fecha de la imagen;
-
columna 05. ‘imgTime’, momento de la imagen; (la fecha de ser subida al servidor);
-
columna 06. ‘imgLon’, localización de la imagen, longitud;
-
columna 07. ‘imgLat’, localización de la imagen, latitud;
-
columna 08. ‘imgClass’, las imágenes pueden haber sido clasificadas con las siguientes categorías:
-
‘mosquito species’ (e.g. ‘Ae. albopictus’, ‘Ae. aegypti’) al reportar alguna de las especies buscadas por el proyecto;
-
‘otherSpecies’, al reportar otra especie de mosquito que no es de las buscadas por el proyecto;
-
‘canNotTell’, cuando la fotografía no permite identificar los caracteres y clasificar la especie;
-
‘site’, cuando se reporta un lugar de cría de mosquitos;
-
‘otherSites’, cuando se reporta un lugar de cría que es rechazado;
-
-
columna 09. ‘imgLabel’, las imagines se han etiquetado con una de las siguientes etiquetas:
-
Si la imagen ha sido validada por un experto, la etiqueta puede ser una de estas: + ‘confirmed’; + ‘probable’ (estas categorías solo se aplican a las especies buscadas por el proyecto);
-
Cuando no ha habido una validación de las imágenes por los expertos, se etiquetan como: + ‘notClassified’,
-
-
columna 10. ‘hidden’, una bandera o señal que por distintas razones (e.g. ofensiva, conflictiva) no se muestra en el mapa público;
TAREAS DE CLASIFICACIÓN SUGERIDAS:
-
Clasificación amplia: clasificar imágenes por clase de imagen
-
Identificación de especies: se sugiere una clasificación binaria suave (por ejemplo, «Ae.albopictus» versus NO_Ae.albopictus)
-
Clasificación 1 del sitio: drenaje / no drenaje. (Las etiquetas específicas para esta tarea se proporcionarán en una próxima versión).
-
Clasificación del sitio 2: desagües con / sin agua. (Las etiquetas específicas para esta tarea se proporcionarán en una próxima versión).
Notas: Un informe puede contener varias imágenes (el mismo «rprtId» para diferentes «imgId»). Por lo general, las imágenes son similares, pero en algunos casos no lo son (por ejemplo, una imagen enfocada y una borrosa, una imagen de un mosquito y una imagen de una picadura). Los expertos validan y etiquetan los informes en función de la imagen más informativa asociada al informe. En aras de la precisión, la imagen más informativa es la única que está etiquetada y el resto permanece como ‘notClassified’. Por esta razón, recomendamos entrenar a los clasificadores solo con imágenes etiquetadas. El conjunto de imágenes ‘notClassified’ podría usarse como un conjunto de prueba considerando las etiquetas del informe como una indicación aproximada de la etiqueta de la imagen.
CONTACTO
Por favor, haznos saber que descargaste los archivos, lo que planea hacer con ellos y cualquier resultado interesante que pueda obtener. Estaremos encantados de saber de ti.
El equipo de Mosquito Alert,
Gracias !