Metodología, Fuentes y Limitaciones
Toda cifra publicada en este DataLab proviene de fuentes públicas oficiales del Estado de Chile, procesada con métodos estadísticos auditables y sujeta a estrictos estándares de anonimización y transparencia. En esta página declaramos las fuentes exactas, los métodos aplicados y las limitaciones conocidas para que cualquier investigador pueda reproducir y verificar nuestros resultados.
Privacidad Mediante k-Anonimato (k ≥ 5)
Para garantizar que ningún productor orgánico individual pueda ser re-identificado o expuesto económicamente, aplicamos de manera rigurosa la técnica de **k-anonimato** con un umbral de $k=5$.
Supresión Visual Directa: Cualquier celda geográfica (Comuna) o de cruce de rubros que contenga menos de 5 operadores registrados es automáticamente suprimida de los listados públicos.
Exclusión de Personas Naturales: Todos los datos publicados corresponden únicamente a estadísticas agrupadas institucionalmente. Se suprimen nombres y campos individuales.
La supresión asegura que, aunque sepamos que la Región de Los Ríos tiene operadores orgánicos, es imposible triangular sus ubicaciones exactas o rubros de manera individualizada.
Universo Poblacional y Regímenes de Certificación
La Ley 20.089 de Chile establece dos regímenes de certificación orgánica diferenciados. Es fundamental comprender esta distinción para interpretar correctamente las cifras de este DataLab.
Operadores certificados por Organismos de Certificación (OC) acreditados por el SAG. Pueden comercializar en todos los canales (nacional e internacional, incluida exportación).
Fuente: SAG · Lista de operadores de OC vigentes · Snapshot al 31-12-2024
Organizaciones de Agricultores Ecológicos con auto-certificación fiscalizada por el SAG. Sus productos solo pueden comercializarse directamente al consumidor final en mercado interno. No compiten en exportación.
Fuente: SAG · Registro OAEs · Actualizado al 12-06-2025
Nota metodológica: Las métricas de concentración de mercado (HHI, Gini, cuotas), distribución geográfica, y análisis de rubros productivos de este DataLab se calculan exclusivamente sobre el universo de 832 operadores únicos del régimen de tercera parte. Las OAEs se presentan de forma complementaria como información del ecosistema orgánico, pero constituyen un universo poblacional separado con reglas de comercialización distintas.
Fuentes Oficiales Primarias
Todos los datos publicados provienen exclusivamente de registros públicos auditables. A continuación se detallan las fuentes primarias con sus URLs oficiales para verificación independiente.
Métodos Estadísticos Aplicados
El listado SAG constituye una población censal completa (no una muestra). Las cuotas reportadas son valores poblacionales, no estimadores. Los intervalos de confianza (vía bootstrap) miden la estabilidad del proceso de deduplicación algorítmica, no incertidumbre muestral clásica.
El archivo fuente SAG contiene 5.300 filas (un operador puede tener múltiples filas por especie/predio). Se aplica un algoritmo de deduplicación determinista que resuelve typos, apellidos invertidos y razones sociales equivalentes, validado con 46 tests unitarios automatizados y auditoría de falsos positivos. Resultado: 832 operadores únicos.
Se calcula el índice de concentración de mercado HHI sobre las cuotas de los 6 OCs acreditados. HHI = 3.699 (IC95 bootstrap [3.468 – 3.989], 2.000 iteraciones). Clasificación DOJ/FTC: mercado altamente concentrado (≥ 2.500).
La distribución de cuotas de mercado entre OCs se visualiza mediante la curva de Lorenz. El coeficiente de Gini calculado es 0.561, indicando desigualdad moderadamente alta. El OC líder concentra el 54,3% de los operadores del mercado.
Se aplican tests χ² de independencia para evaluar asociaciones estructurales (OC × Región, Segmento × OC) con corrección Holm-Bonferroni para control del error familiar (FWER α=0,05). Los tamaños de efecto se reportan mediante V de Cramér (rango 0,156 – 0,43).
Trazabilidad, Anonimización y Reproducibilidad
La ingesta de datos parte exclusivamente del Listado Oficial de Operadores del SAG y del Registro de OAEs del SAG. Cualquier investigador puede descargar las mismas fuentes desde los enlaces oficiales listados arriba y reproducir el proceso.
Toda celda geográfica o cruce de rubros con menos de 5 operadores se suprime de las visualizaciones públicas. Las personas naturales se excluyen del análisis de presencia digital. No se publican rankings nominativos de OCs ni datos individualizables.
Cada dataset consolidado posee un manifiesto de procedencia inmutable con firma criptográfica SHA256 que detalla las transformaciones aplicadas, criterios de anonimización y fuente de origen, garantizando la inalterabilidad de los resultados.
Limitaciones Metodológicas
La transparencia científica exige declarar explícitamente las limitaciones conocidas del análisis.
Snapshot temporal único (2024): Los datos corresponden a un corte puntual del listado SAG. No es posible inferir tendencias temporales ni tasas de crecimiento sin un segundo snapshot de otro periodo.
No existe fuente pública externa de cuotas por OC: El SAG registra operadores pero no publica análisis de cuotas de mercado entre certificadoras. Las cuotas aquí presentadas son de cálculo propio derivado del dato público. Este DataLab constituiría la primera fuente pública con esta información.
Triangulación parcial con ODEPA: El último reporte público de ODEPA sobre agricultura orgánica con cifras desagregadas data de 2022. La triangulación exacta del total de 832 operadores contra una fuente independiente no fue posible al cierre de la investigación.
Artefactos de codificación SAG: Ciertas categorías como "Según Anexo" o "fresh" son artefactos del sistema de codificación del SAG, no especies biológicas reales. Se conservan en el conteo por fidelidad a la fuente pero no representan diversidad productiva real.
Tolerancia de deduplicación: El algoritmo de deduplicación robusto (v3) prioriza conservadoramente la no-fusión de registros ambiguos. Esto implica que la cifra de 832 operadores podría sobrecontar 5-10 entidades genuinas con errores tipográficos intrapalabra no resueltos.
Exclusión del norte grande: Tres regiones (Tarapacá, Antofagasta, Atacama) no presentan operadores en el régimen de tercera parte. Sí existen OAEs en Tarapacá (4 organizaciones aymara). La ausencia es coherente con la geografía desértica pero no se verificó si existen operadores omitidos.
Licencia Creative Commons (CC-BY 4.0)
Queremos que esta información sea de utilidad pública para investigadores, estudiantes, periodistas y profesionales del sector ecológico. Toda la base de datos de este DataLab está bajo la licencia **CC-BY 4.0**. Puedes compartir, copiar y adaptar la información libremente, siempre que cites a **BioAudita** como la fuente original de los datos.