Un dato es una representación simbólica de un hecho, concepto o entidad que puede ser registrado, almacenado y procesado. Los datos son la materia prima de la ciencia, que cada vez es más centrada en datos resultado del poder tecnológico que representa el cómputo. Aquí hay algunas características clave de los datos científicos:
- Metadatos: datos que describen con detalle el conjunto de los datos respecto a su historia, autoría, licencia, origen, identificadores, etc...
- Representación: Los datos representan hechos o entidades del mundo real. Pueden ser numéricos, textuales, visuales o de otro tipo, dependiendo de lo que estén registrando.
- Atomizados: Los datos suelen ser elementos individuales y discretos. Por ejemplo, una fecha, un número, una palabra o una imagen pueden ser considerados datos.
- Estructura: Los datos pueden tener una estructura definida. Por ejemplo, una tabla de datos tiene filas y columnas que organizan la información de manera sistemática.
- Contexto: Los datos a menudo deben interpretarse en un contexto específico para tener sentido. Por sí mismos, los datos pueden carecer de significado.
- Relevancia: Los datos pueden ser relevantes o no dependiendo de su utilidad en un contexto particular. Lo que es un dato valioso en una situación puede no serlo en otra.
- Procesamiento: Los datos pueden ser procesados, analizados y transformados en información. Esto implica extraer significado, identificar patrones o realizar cálculos.
- Es deseable implementar planes de manejo de datos científicos
- Una buena práctica de la ciencia abierta es generar datos que sigan los principios FAIR
- Una buena fuente para localizar datos científicos son los repositorios de datos producto de investigación.
Una de las implicaciones más profundas de la tecnología en las biociencias es la transformación digital de los datos y su repercusión en la cantidad y diversidad de procesamientos que se pueden realizar, el impacto de todo esto en el ciclo de vida de la investigación, la cultura académica y el consumo de información ha sido rápido y radical, entender estos cambios, su historia, retos y perspectivas es el principal objetivo de varios especialistas interesados en los biodatos como Leonelli, quienes realizan contribuciones significativas al nuevo conocimiento sobre este fenómeno.
Entre los objetivos del proyecto BIOcolores están indagar sobre los datos, estos son algunos de las preguntas que nos interesan cubrir son:
- ¿Cualés son las fuentes de datos de investigación disponibles para biología del color?
- ¿Qué conjuntos de datos pueden ser reutilizados?
- ¿Qué tipo de iniciativas, normas y herramientas se aplican en su gestión?
- ¿Cuál es el ciclo de los datos?
- ¿Cuál es el impacto de esos datos en la comunidad académica y en la sociedad?
Las fuentes de datos para biología del color se pueden clasificar en tres tipos: 1) Las que albergan conjuntos de datos publicados en artículos académicos, 2) Las constituidas por bases de datos biológicas y 3) Los conjuntos de datos generados aisladamente con el objetivo de generar visualizaciones interesantes. Veamos algunos ejemplos de esto.
En los repositorios de datos académicos como Zenodo, Figshare y Datacite se depositan conjuntos de datos de artículos académicos en donde es posible localizar los que tratan sobre coloración por medio de búsquedas. También hay repositorios especializados en los que existe información como los siguientes:
https://www.gbif.org/search?q=color
Hemos reunido una lista con las bases de datos biológicas que vamos encontrando que contienen datos de interés para biología del color en hypothes.is que se puede consultar en la siguiente liga
Entre los conjuntos de datos disponibles para hacer investigación in silico para biocolores están los siguientes:
- https://www.kaggle.com/search?q=color
- https://commons.wikimedia.org/wiki/Category:Plants_named_after_colours
- https://en.wikipedia.org/wiki/Iris_flower_data_set
- https://datasetsearch.research.google.com/search?src=0&query=color&docid=L2cvMTFrcXZtZ3A0ag%3D%3D
Comentarios
Publicar un comentario