History¶
0.2.17 (2017-07-18)¶
- Agrega un método para convertir un intervalo repetido (Ej.: R/P1Y) en su representación en prosa (“Anualmente”).
- Agrego método que estima los datasets federados que fueron borrados de un catálogo específico. Se consideran datasets federados y borrados de un catálogo específico aquellos cuyo publisher.name existe dentro de algún otro dataset todavía presente en el catálogo específico.
0.2.16 (2017-07-13)¶
- Bug fix: convierte a unicode antes de escribir un objeto a JSON.
0.2.15 (2017-07-11)¶
- Modifica la definición de dataset actualizado usando el campo “modified” del perfil de metadatos. Si este campo no está presente en la metadata de un dataset, se lo considera desactualizado.
0.2.14 (2017-07-10)¶
- Modifica la definición de dataset usada para comparar limitándola a la comparación por “title” y “publisher_name”.
0.2.13 (2017-06-22)¶
- Agrega método para verificar si un dataset individual está actualizado
0.2.12 (2017-06-22)¶
- Se modifica el template de CATALOG README
- Se agrega el indicador “datasets_no_federados” a generate_catalogs_indicators
0.2.11 (2017-05-23)¶
- Se agrega en
core
el métodoDataJson.generate_catalogs_indicators
, que genera indicadores de monitoreo de catálogos, recopilando información sobre, entre otras cosas, su validez, actualidad y formato de sus contenidos.
0.2.10 (2017-05-11)¶
- Correción ortográfica del listado de frecuencias de actualización admisibles (
pydatajson/schemas/accrualPeriodicity.json
).
0.2.9 (2017-05-04)¶
- Hotfixes para que
pydatajson
sea deployable en nuevos entornos donde elsetup.py
estaba fallando.
0.2.5 (2017-02-16)¶
- Se agrega una nueva función a
readers
,read_ckan_catalog
, que traduce los metadatos que disponibiliza la Action API v3 de CKAN al estándardata.json
. Esta función no está integrada aread_catalog
. - Se modifican todos los esquemas de validación, de modo que los campos opcionales de cualquier tipo y nivel acepten strings vacías.
0.2.0 (2017-01-31)¶
- Se reestructura la librería en 4 módulos:
core
,readers
,writers
yhelpers
. Toda la funcionalidad se mantiene intacta, pero algunas funciones muy utilizadas cambian de módulo. En particular,pydatajson.pydatajson.read_catalog
es ahorapydatajson.readers.read_catalog
, ypydatajson.xlsx_to_json.write_json_catalog
es ahorapydatajson.writers.write_json_catalog
(opydatajson.writers.write_json
). - Se agrega el parámetro
frequency
apydatajson.DataJson.generate_harvester_config
, que controla la frecuencia de cosecha que se pretende de los datasets a incluir en el archivo de configuración. Por omisión, se usa'R/P1D'
(diariamente) para todos los datasets. - Se agrega la carpeta
samples/
, con dos rutinas de transformación y reporte sobre catálogos de metadatos en formato XLSX.
0.1.7 (2017-01-10)¶
- Se agrega el módulo
xlsx_to_json
, con dos métodos para lectura de archivos locales o remotos, sean JSON genéricos (xlsx_to_json.read_json()
) o metadatos de catálogos en formato XLSX (read_local_xlsx_catalog()
). - Se agrega el método
pydatajson.read_catalog()
que interpreta todos las representaciones externas o internas de catálogos conocidas, y devuelve un diccionario con sus metadatos.
0.1.6 (2017-01-04)¶
- Se incorpora el método
DataJson.generate_harvestable_catalogs()
, que filtra los datasets no deseados de un conjunto de catálogos. - Se agrega el parámetro
harvest
a los métodosDataJson.generate_harvestable_catalogs()
,DataJson.generate_datasets_report()
yDataJson.generate_harvester_config()
, para controlar el criterio de elección de los datasets a cosechar. - Se agrega el parámetro
export_path
a los métodosDataJson.generate_harvestable_catalogs()
,DataJson.generate_datasets_report()
yDataJson.generate_harvester_config()
, para controlar la exportación de sus resultados.
0.1.4 (2016-12-23)¶
- Se incorpora el método
DataJson.generate_datasets_report()
, que reporta sobre los datasets y la calidad de calidad de metadatos de un conjunto de catálogos. - Se incorpora el método
DataJson.generate_harvester_config()
, que crea archivos de configuración para el Harvester a partir de los reportes degenerate_datasets_report()
.
0.1.3 (2016-12-19)¶
- Al resultado de
DataJson.validate_catalog()
se le incorpora una lista ("errors"
) con información de los errores encontrados durante la validación en cada nivel de jerarquía (“catalog” y cada elemento de “dataset”)
0.1.2 (2016-12-14)¶
- Se incorpora validación de tipo y formato de campo
- Los métodos
DataJson.is_valid_catalog()
yDataJson.validate_catalog()
ahora aceptan undict
además de unpath/to/data.json
o una url a un data.json.
0.1.0 (2016-12-01)¶
Primera versión para uso productivo del paquete.
- La instalación via
pip install
debería reconocer correctamente la ubicación de los validadores por default. - El manejo de data.json’s ubicados remotamente se hace en función del resultado de
urlparse.urlparse
- El formato de respuesta de
validate_catalog
se adecúa a la última especificación (versamples/validate_catalog_returns.json
.
0.0.13 (2016-11-25)¶
- Intentar que la instalación del paquete sepa donde están instalados los schemas por default
0.0.12 (2016-11-25)¶
- Primera versión propuesta para v0.1.0