Batarce, M. (2024) Estimation of discrete choice models with error in variables: An application to revealed preference data with aggregate service level variables. Transportation Research Part B: Methodological. https://doi.org/10.1016/j.trb.2024.102985
– Cuál es el gap que buscaban resolver y por qué es importante
El artículo propone un método para estimar sin sesgo los parámetros de los modelos de elección discreta cuando no se tiene datos desagregados para todas las alternativas y observaciones. Este método es importante porque permite usar datos recolectados de una encuesta de preferencias reveladas, como las EODs que hacemos en Chile, y estimar los modelos de partición modal sin recolectar datos para cada individuo en la muestra y cada alternativa de viaje.
– Breve reseña de metodología y datos que utilizaron
La metodología está basada en la estimación de modelos no lineales con error de medición en las variables. Específicamente, se asume que, por ejemplo, no se conoce exactamente el tiempo de viaje entre el origen y el destino de los viajes de los usuarios, pero se tiene una medida aproximada. Esta medida puede ser el tiempo de viaje entre zonas de origen y destino obtenidos de un modelo de asignación a la red. Es decir, se tiene tiempos de viaje agregados por zona. El artículo muestra que si se tiene una muestra de tiempos bien medidos (desde el origen hasta el destino), se puede usar para corregir la estimación. No tiene que ser el tiempo de viaje de todos los modos disponibles simultáneamente, pueden ser muestras independientes. Por ejemplo, una para el auto y otra para el bus.
En el caso de las EODs siempre se recolecta información del tiempo de viaje del modo escogido por el usuario. Asumiendo que esa medida es correcta, se puede utilizar para corregir la estimación con toda la muestra y con tiempo de viaje entre zonas (agregados espacialmente). El método permite corregir modelos sin y con parámetros aleatorios. La parte fundamental es estimar la densidad condicional del tiempo de viaje desagregado (correcto) dado el tiempo agregado (con error). Luego hay que integrar la función de verosimilitud, por lo que se requiere usar simulación, como en el caso del modelo logit mixto.
En el artículo utilizan datos simulados y datos reales de la EOD de Santiago de 2012 y de los corredores San Miguel – Centro y Las Condes – Centro. Los resultados indican que el método propuesto elimina el sesgo por usar datos agregados al estimar los parámetros.
– Impacto potencial de los resultados obtenidos en el estado de la práctica y o diseño de políticas de transporte en Chile
Una primera versión de este método la usé para estimar los parámetros con los que se calculó el valor del tiempo de viaje urbano del Sistema Nacional de Inversiones desde el 2014 hasta hace unos años. Ese es un impacto real de esta investigación.
Además, se puede utilizar para estimar modelo de elección usando los datos de las encuestas de movilidad que se levantan en Chile. Sé que eso se hace actualmente, pero como no se corrige el error de medición, esos modelos son sesgados e inconsistentes. Es decir, los parámetros son incorrectos y, en consecuencia, las estimaciones de demanda también.