Una década después de DARPA: Argo AI de Ford muestra su visión sobre la conducción autónoma
Tan solo unos meses antes de su primer cumpleaños, el equipo de Argo AI ha crecido a casi 200 empleados y ahora tiene vehículos de prueba en la carretera en Pittsburgh y el sudeste de Michigan.
Hace una década en el alto desierto de California, 11 finalistas compitieron en una carrera sin precedentes de 60 millas. Los autos robot necesitaban completar de manera segura y rápida la misión sin intervención humana, a la vez que interactuaban con vehículos impulsados por humanos, en menos de seis horas.
Fue el Desafío Urbano DARPA 2007, una competencia de vehículos autónomos que inició oficialmente las iniciativas de tecnología de auto-conducción de hoy. Los vehículos fueron considerados increíbles en ese momento, y mirando hacia atrás, esto marcó el comienzo de un largo viaje.
DARPA aseguró cierto nivel de éxito administrando cuidadosamente el alcance: los participantes aceptaron un conjunto de reglas de tráfico rigurosamente definidas, y DARPA eliminó el tráfico de peatones y ciclistas del desafío. A pesar de estas simplificaciones, lo que lograron los equipos fue impresionante, ya que la mayoría reunió sus sistemas en gran parte desde cero en solo 18 meses.
El desafío de DARPA destacó la necesidad de un desarrollo de algoritmos y potencia computacional más avanzada. En ese momento, dependíamos en gran medida de las técnicas de programación basadas en reglas, lo que significaba que los sistemas robóticos de hace una década tendían a funcionar solo en entornos muy limitados, en torno a usuarios de buena conducta que no se desviarían mucho de un conjunto establecido de reglas.
Muchos de nosotros en Argo hemos trabajado en el campo de la robótica y los automóviles automotores durante más de una década, y mientras trabajamos para llevar esta tecnología a las masas, estamos aprovechando nuestra amplia experiencia, incluidos nuestros aprendizajes del DARPA Urban Challenge . Tan solo unos meses antes del primer cumpleaños de Argo AI, hemos logrado reunir un equipo experimentado de casi 200 empleados, y ahora tenemos vehículos de prueba en la carretera en Pittsburgh y el sudeste de Michigan.
Conocemos de primera mano los desafíos que conlleva la comercialización del software y el hardware que alimenta sistemas altamente automatizados e inteligentes. Trabajando en condiciones al aire libre entre el tráfico de vehículos, los peatones y ciclistas que operan sin cumplir estrictamente un conjunto de reglas pueden ser complicados. Los efectos de las condiciones del mundo real como la noche y el día, el clima cambiante, las diferentes geometrías de caminos y los materiales pueden agravar las cosas. La dinámica del entorno trae inconsistencias y variabilidad a lo que los constructores de sistemas robóticos tradicionalmente han necesitado para simplificar en un conjunto básico de supuestos.
En los últimos años, el juego ha cambiado debido en parte al poder computacional ahora disponible, pero con esto ha surgido un nuevo conjunto de complejidades que aún estamos aprendiendo a manejar. Muchos avances en el procesamiento de energía, almacenamiento e inteligencia artificial se están uniendo para que estas computadoras puedan razonar a través de problemas sin requerir un script. Podrán aprender de grandes cantidades de datos, reconocer patrones con sorprendente precisión y filtrar entradas anómalas de los sensores para enfocarse en lo que más importa.
A medida que abracemos estos avances, lo hacemos sabiendo que ninguna herramienta, técnica o algoritmo solo resolverá categóricamente todos los desafíos de auto-conducción. Aquí presentamos algunas consideraciones para construir cuidadosamente un auto de conducción autónoma.
Sensores
Los sensores todavía tienen un largo camino por recorrer. Utilizamos los sensores LiDAR, que funcionan bien en condiciones de poca luz, para tomar la geometría tridimensional del mundo alrededor del automóvil, pero LiDAR no proporciona color ni textura, por lo que usamos cámaras para eso. Sin embargo, las cámaras son desafiadas con poca luz y tienden a luchar para proporcionar suficiente foco y resolución en todos los rangos de operación deseados. En contraste, el radar, aunque tiene una resolución relativamente baja, puede detectar directamente la velocidad de los usuarios de la carretera, incluso a grandes distancias.
Es por eso que todavía tenemos tantos sensores montados en el automóvil: las fortalezas de uno complementan las debilidades de otro. Los sensores individuales no reproducen completamente lo que capturan, por lo que la computadora debe combinar las entradas de múltiples sensores, luego ordenar los errores e inconsistencias. Combinar todo esto en una imagen completa y robusta del mundo para que la computadora lo procese es increíblemente difícil.
Desarrollar un sistema que pueda fabricarse e implementarse a escala con hardware rentable y mantenible es aún más desafiante. Estamos innovando en el conjunto de hardware y software de detección para reducir costos, reducir el conteo de sensores y mejorar el alcance y la resolución. Queda mucho trabajo por hacer para lograr estos objetivos conflictivos y lograr que la tecnología alcance una escala confiable.
Entendiendo el mundo
Una vez que un vehículo autónomo tiene las herramientas para "ver" los objetos relevantes a su alrededor, es el propio automóvil el que debe dar el siguiente paso: identificar el tipo de objeto, ya sea un peatón, un ciclista, otro vehículo o escombros en la carretera y qué tan rápido se mueve ese objeto. El automóvil debe entonces tomar una determinación sobre el probable comportamiento de ese objeto.
Los avances en la inteligencia artificial y el aprendizaje automático, impulsados por opciones cada vez mayores de computación y almacenamiento en la nube, han alimentado nuevos algoritmos e impulsado nuevos giros en los antiguos algoritmos. Estas nuevas herramientas son increíblemente poderosas en la creación de algoritmos que pueden tamizar de manera robusta millones de píxeles de información que fluyen de nuestros sensores cada segundo, y luego hacer determinaciones sobre la ubicación, el tamaño y la velocidad de los usuarios de la carretera relevantes para el automóvil.
Una parte del proceso en la construcción de estos algoritmos es recolectar millones de kilómetros de datos del mundo real de nuestros sensores, luego usar esa información para enseñar un algoritmo para detectar a los usuarios de la ruta relevantes a pesar de los desafíos que presentan los datos de los sensores ruidosos o erróneos. Las cadenas de herramientas y los equipos de operaciones importantes administran este flujo de datos y el proceso de desarrollo.
Nuestros primeros resultados son realmente impresionantes, pero sabemos muy bien que el diablo siempre está en los detalles.
Cuando conducimos un automóvil hoy, subconscientemente estamos estimando los próximos segundos de comportamiento de otros usuarios de la carretera, anticipando cuándo un peatón podría caminar o cuando otro automóvil podría estar a punto de interrumpirnos. Los conductores atentos son increíblemente buenos para reaccionar en estas situaciones: gestionar su velocidad y planificar contingencias para adaptarse a comportamientos anómalos de los demás. Estas mismas acciones, que los buenos conductores realizan rápidamente y evitan una respuesta drástica, también son necesarias para que un auto que maneje navegue por las calles ajetreadas de la ciudad.
Debemos construir algoritmos que permitan a nuestro vehículo autónomo responder a una comprensión más profunda del comportamiento probable de otros usuarios de la carretera. Debemos inculcar "consideración" a la tecnología para garantizar que el automóvil pueda funcionar de manera segura, confiable y predecible.
Por ejemplo, el automóvil necesita saber cuándo tendrá que moverse ligeramente por un camión grande para darle más espacio, o ajustar su velocidad para mantenerse fuera del punto ciego de otro conductor. Al mismo tiempo, tenemos que construir algoritmos que le permitan saber cuándo es demasiado conservador, cuando el automóvil necesitará "empujar" en el tráfico denso o comprometerse a una acción consistente para que otros usuarios de la carretera puedan responder correctamente. A lo largo, como la computadora absorbe toda la información, es clave que nunca se distraiga o aprenda el modelo equivocado, ya que actuará de manera extraña en anticipación de una acción que nunca llega a realizarse.
Este es el equilibrio que debemos cumplir al construir estos modelos predictivos, y es solo a partir de todos estos ejemplos y la conducción en el mundo real que podemos aprender a predecir las micro-maniobras que resultan ser los indicadores principales de las acciones probables de otros usuarios de la carretera.
Integración y prueba del sistema
En general, el software que alimenta un automóvil auto-conducido es lo que se llama un sistema estocástico. Lo que esto significa es que los resultados se determinan a través de una serie de patrones y modelos detectados aplicados a entradas de sensores inherentemente aleatorias, en lugar de a través de una ecuación matemática con un conjunto consistente de entradas que se traduce en un conjunto consistente de resultados.
Imagine conducir por el mismo camino dos veces y nada cambia entre el primer y el segundo viaje. Es muy poco probable que manejes el mismo camino a la misma velocidad la segunda vez. Los vehículos de auto-conducción no son diferentes, aunque en general serán más consistentes que los conductores humanos.
La prueba de los sistemas estocásticos requiere un número significativo de repeticiones generadas por datos del mundo real para que sea representativo. Eso significa que debemos reunir millones de millas de experiencia vial para enseñar al software a conducir con confianza. (¡Imagine la necesidad de conducir millones de millas para obtener su licencia de conducir!) Pero no todas las millas se crean iguales, por lo que "millas acumuladas" no es una métrica lo suficientemente expresiva para rastrear el progreso. Piénselo de esta manera: las habilidades que adquirió aprendiendo a conducir en una tranquila ciudad del Medio Oeste no se traducirán si se encuentra manejando en el corazón de Manhattan.
Los algoritmos que construimos mueven millones de píxeles por segundo a través de matemáticas y lógica complejas para calcular resultados importantes sobre el estado del mundo de un vehículo autónomo. Dada la alta dimensionalidad de estas entradas, es imposible probar en el espacio de cada combinación de entradas posible, habría muchos billones de combinaciones para probar, lo que es simplemente ingobernable.
Por lo tanto, debemos ser inteligentes sobre cómo utilizamos los kilómetros recorridos de experiencia de conducción de nuestros vehículos de prueba. Estamos construyendo herramientas que pueden extraer el conjunto correcto de millas que cubre lo suficiente los escenarios realistas y relevantes que es probable que vea el vehículo, y luego probar la respuesta correcta. Este equilibrio requiere una amplia experiencia de conducción y la recopilación de datos en el área de despliegue objetivo que cubre tantos escenarios diversos y desafiantes como sea posible. También debemos recopilar variaciones suficientes en torno a los cambios ambientales en cada escenario que puedan degradar la salida de un sensor, como el clima y las condiciones de iluminación.
Hemos creado un equipo dedicado de operadores de logística y pruebas para ejecutar de forma segura estas millas de prueba, además de un equipo de profesionales de análisis e ingenieros de software que están creando las herramientas para administrar el flujo de datos que nos brindan confianza en nuestra integridad en la cobertura de escenarios.
Todavía estamos en los primeros tiempos de hacer realidad los autos de conducción automática. Aquellos que piensan que los vehículos totalmente automotores serán omnipresentes en las calles de la ciudad dentro de unos meses o incluso en algunos años no están bien conectados con el estado de la técnica o comprometidos con el despliegue seguro de la tecnología. Para aquellos de nosotros que hemos estado trabajando en la tecnología durante mucho tiempo, les vamos a decir que el problema es aún muy difícil, ya que los sistemas son tan complejos como siempre.
Todo el mundo sabe que los equipos enfocados que innovan y trabajan duro pueden resolver problemas sorprendentemente difíciles. En Argo, vemos estos desafíos como una inspiración. Nos impulsan a aprovechar los avances de la última década para impulsarnos hacia una nueva era en la que el éxito comercial de los automóviles automotores será una realidad.
Estamos adoptando un enfoque pragmático para lograr automóviles totalmente automotores, incorporando el estado de la técnica y reconociendo que no hay una bala de plata. Estamos jugando el juego largo y evitamos la publicidad en nuestro compromiso de llevar esta importante tecnología a la madurez en la forma de un gran producto que gana la confianza de millones de personas en todo el mundo.
- Hace una década, el DARPA Urban Challenge 2007 inició de manera extraoficial las iniciativas tecnológicas de conducción propia de hoy en día, y destacó la necesidad de un desarrollo de algoritmos y potencia computacional más avanzada.
- Muchos miembros del equipo de Argo AI han estado en el campo de la robótica y los autos de conducción autónoma durante más de una década, y mientras trabajamos para llevar esta tecnología a las masas, estamos aprovechando nuestra amplia experiencia, incluidos nuestros aprendizajes del DARPA Urban Challenge .
Tan solo unos meses antes de su primer cumpleaños, el equipo de Argo AI ha crecido a casi 200 empleados y ahora tiene vehículos de prueba en la carretera en Pittsburgh y el sudeste de Michigan.
Hace una década en el alto desierto de California, 11 finalistas compitieron en una carrera sin precedentes de 60 millas. Los autos robot necesitaban completar de manera segura y rápida la misión sin intervención humana, a la vez que interactuaban con vehículos impulsados por humanos, en menos de seis horas.
Fue el Desafío Urbano DARPA 2007, una competencia de vehículos autónomos que inició oficialmente las iniciativas de tecnología de auto-conducción de hoy. Los vehículos fueron considerados increíbles en ese momento, y mirando hacia atrás, esto marcó el comienzo de un largo viaje.
DARPA aseguró cierto nivel de éxito administrando cuidadosamente el alcance: los participantes aceptaron un conjunto de reglas de tráfico rigurosamente definidas, y DARPA eliminó el tráfico de peatones y ciclistas del desafío. A pesar de estas simplificaciones, lo que lograron los equipos fue impresionante, ya que la mayoría reunió sus sistemas en gran parte desde cero en solo 18 meses.
El desafío de DARPA destacó la necesidad de un desarrollo de algoritmos y potencia computacional más avanzada. En ese momento, dependíamos en gran medida de las técnicas de programación basadas en reglas, lo que significaba que los sistemas robóticos de hace una década tendían a funcionar solo en entornos muy limitados, en torno a usuarios de buena conducta que no se desviarían mucho de un conjunto establecido de reglas.
Muchos de nosotros en Argo hemos trabajado en el campo de la robótica y los automóviles automotores durante más de una década, y mientras trabajamos para llevar esta tecnología a las masas, estamos aprovechando nuestra amplia experiencia, incluidos nuestros aprendizajes del DARPA Urban Challenge . Tan solo unos meses antes del primer cumpleaños de Argo AI, hemos logrado reunir un equipo experimentado de casi 200 empleados, y ahora tenemos vehículos de prueba en la carretera en Pittsburgh y el sudeste de Michigan.
Conocemos de primera mano los desafíos que conlleva la comercialización del software y el hardware que alimenta sistemas altamente automatizados e inteligentes. Trabajando en condiciones al aire libre entre el tráfico de vehículos, los peatones y ciclistas que operan sin cumplir estrictamente un conjunto de reglas pueden ser complicados. Los efectos de las condiciones del mundo real como la noche y el día, el clima cambiante, las diferentes geometrías de caminos y los materiales pueden agravar las cosas. La dinámica del entorno trae inconsistencias y variabilidad a lo que los constructores de sistemas robóticos tradicionalmente han necesitado para simplificar en un conjunto básico de supuestos.
En los últimos años, el juego ha cambiado debido en parte al poder computacional ahora disponible, pero con esto ha surgido un nuevo conjunto de complejidades que aún estamos aprendiendo a manejar. Muchos avances en el procesamiento de energía, almacenamiento e inteligencia artificial se están uniendo para que estas computadoras puedan razonar a través de problemas sin requerir un script. Podrán aprender de grandes cantidades de datos, reconocer patrones con sorprendente precisión y filtrar entradas anómalas de los sensores para enfocarse en lo que más importa.
A medida que abracemos estos avances, lo hacemos sabiendo que ninguna herramienta, técnica o algoritmo solo resolverá categóricamente todos los desafíos de auto-conducción. Aquí presentamos algunas consideraciones para construir cuidadosamente un auto de conducción autónoma.
Sensores
Los sensores todavía tienen un largo camino por recorrer. Utilizamos los sensores LiDAR, que funcionan bien en condiciones de poca luz, para tomar la geometría tridimensional del mundo alrededor del automóvil, pero LiDAR no proporciona color ni textura, por lo que usamos cámaras para eso. Sin embargo, las cámaras son desafiadas con poca luz y tienden a luchar para proporcionar suficiente foco y resolución en todos los rangos de operación deseados. En contraste, el radar, aunque tiene una resolución relativamente baja, puede detectar directamente la velocidad de los usuarios de la carretera, incluso a grandes distancias.
Es por eso que todavía tenemos tantos sensores montados en el automóvil: las fortalezas de uno complementan las debilidades de otro. Los sensores individuales no reproducen completamente lo que capturan, por lo que la computadora debe combinar las entradas de múltiples sensores, luego ordenar los errores e inconsistencias. Combinar todo esto en una imagen completa y robusta del mundo para que la computadora lo procese es increíblemente difícil.
Desarrollar un sistema que pueda fabricarse e implementarse a escala con hardware rentable y mantenible es aún más desafiante. Estamos innovando en el conjunto de hardware y software de detección para reducir costos, reducir el conteo de sensores y mejorar el alcance y la resolución. Queda mucho trabajo por hacer para lograr estos objetivos conflictivos y lograr que la tecnología alcance una escala confiable.
Entendiendo el mundo
Una vez que un vehículo autónomo tiene las herramientas para "ver" los objetos relevantes a su alrededor, es el propio automóvil el que debe dar el siguiente paso: identificar el tipo de objeto, ya sea un peatón, un ciclista, otro vehículo o escombros en la carretera y qué tan rápido se mueve ese objeto. El automóvil debe entonces tomar una determinación sobre el probable comportamiento de ese objeto.
Los avances en la inteligencia artificial y el aprendizaje automático, impulsados por opciones cada vez mayores de computación y almacenamiento en la nube, han alimentado nuevos algoritmos e impulsado nuevos giros en los antiguos algoritmos. Estas nuevas herramientas son increíblemente poderosas en la creación de algoritmos que pueden tamizar de manera robusta millones de píxeles de información que fluyen de nuestros sensores cada segundo, y luego hacer determinaciones sobre la ubicación, el tamaño y la velocidad de los usuarios de la carretera relevantes para el automóvil.
Una parte del proceso en la construcción de estos algoritmos es recolectar millones de kilómetros de datos del mundo real de nuestros sensores, luego usar esa información para enseñar un algoritmo para detectar a los usuarios de la ruta relevantes a pesar de los desafíos que presentan los datos de los sensores ruidosos o erróneos. Las cadenas de herramientas y los equipos de operaciones importantes administran este flujo de datos y el proceso de desarrollo.
Nuestros primeros resultados son realmente impresionantes, pero sabemos muy bien que el diablo siempre está en los detalles.
![]() |
Ford Argo AI |
![]() |
Ford Argo AI |
![]() |
Ford Argo AI |
Predicción
Cuando conducimos un automóvil hoy, subconscientemente estamos estimando los próximos segundos de comportamiento de otros usuarios de la carretera, anticipando cuándo un peatón podría caminar o cuando otro automóvil podría estar a punto de interrumpirnos. Los conductores atentos son increíblemente buenos para reaccionar en estas situaciones: gestionar su velocidad y planificar contingencias para adaptarse a comportamientos anómalos de los demás. Estas mismas acciones, que los buenos conductores realizan rápidamente y evitan una respuesta drástica, también son necesarias para que un auto que maneje navegue por las calles ajetreadas de la ciudad.
Debemos construir algoritmos que permitan a nuestro vehículo autónomo responder a una comprensión más profunda del comportamiento probable de otros usuarios de la carretera. Debemos inculcar "consideración" a la tecnología para garantizar que el automóvil pueda funcionar de manera segura, confiable y predecible.
Por ejemplo, el automóvil necesita saber cuándo tendrá que moverse ligeramente por un camión grande para darle más espacio, o ajustar su velocidad para mantenerse fuera del punto ciego de otro conductor. Al mismo tiempo, tenemos que construir algoritmos que le permitan saber cuándo es demasiado conservador, cuando el automóvil necesitará "empujar" en el tráfico denso o comprometerse a una acción consistente para que otros usuarios de la carretera puedan responder correctamente. A lo largo, como la computadora absorbe toda la información, es clave que nunca se distraiga o aprenda el modelo equivocado, ya que actuará de manera extraña en anticipación de una acción que nunca llega a realizarse.
Este es el equilibrio que debemos cumplir al construir estos modelos predictivos, y es solo a partir de todos estos ejemplos y la conducción en el mundo real que podemos aprender a predecir las micro-maniobras que resultan ser los indicadores principales de las acciones probables de otros usuarios de la carretera.
Integración y prueba del sistema
En general, el software que alimenta un automóvil auto-conducido es lo que se llama un sistema estocástico. Lo que esto significa es que los resultados se determinan a través de una serie de patrones y modelos detectados aplicados a entradas de sensores inherentemente aleatorias, en lugar de a través de una ecuación matemática con un conjunto consistente de entradas que se traduce en un conjunto consistente de resultados.
Imagine conducir por el mismo camino dos veces y nada cambia entre el primer y el segundo viaje. Es muy poco probable que manejes el mismo camino a la misma velocidad la segunda vez. Los vehículos de auto-conducción no son diferentes, aunque en general serán más consistentes que los conductores humanos.
La prueba de los sistemas estocásticos requiere un número significativo de repeticiones generadas por datos del mundo real para que sea representativo. Eso significa que debemos reunir millones de millas de experiencia vial para enseñar al software a conducir con confianza. (¡Imagine la necesidad de conducir millones de millas para obtener su licencia de conducir!) Pero no todas las millas se crean iguales, por lo que "millas acumuladas" no es una métrica lo suficientemente expresiva para rastrear el progreso. Piénselo de esta manera: las habilidades que adquirió aprendiendo a conducir en una tranquila ciudad del Medio Oeste no se traducirán si se encuentra manejando en el corazón de Manhattan.
Los algoritmos que construimos mueven millones de píxeles por segundo a través de matemáticas y lógica complejas para calcular resultados importantes sobre el estado del mundo de un vehículo autónomo. Dada la alta dimensionalidad de estas entradas, es imposible probar en el espacio de cada combinación de entradas posible, habría muchos billones de combinaciones para probar, lo que es simplemente ingobernable.
Por lo tanto, debemos ser inteligentes sobre cómo utilizamos los kilómetros recorridos de experiencia de conducción de nuestros vehículos de prueba. Estamos construyendo herramientas que pueden extraer el conjunto correcto de millas que cubre lo suficiente los escenarios realistas y relevantes que es probable que vea el vehículo, y luego probar la respuesta correcta. Este equilibrio requiere una amplia experiencia de conducción y la recopilación de datos en el área de despliegue objetivo que cubre tantos escenarios diversos y desafiantes como sea posible. También debemos recopilar variaciones suficientes en torno a los cambios ambientales en cada escenario que puedan degradar la salida de un sensor, como el clima y las condiciones de iluminación.
Hemos creado un equipo dedicado de operadores de logística y pruebas para ejecutar de forma segura estas millas de prueba, además de un equipo de profesionales de análisis e ingenieros de software que están creando las herramientas para administrar el flujo de datos que nos brindan confianza en nuestra integridad en la cobertura de escenarios.
Todavía estamos en los primeros tiempos de hacer realidad los autos de conducción automática. Aquellos que piensan que los vehículos totalmente automotores serán omnipresentes en las calles de la ciudad dentro de unos meses o incluso en algunos años no están bien conectados con el estado de la técnica o comprometidos con el despliegue seguro de la tecnología. Para aquellos de nosotros que hemos estado trabajando en la tecnología durante mucho tiempo, les vamos a decir que el problema es aún muy difícil, ya que los sistemas son tan complejos como siempre.
Todo el mundo sabe que los equipos enfocados que innovan y trabajan duro pueden resolver problemas sorprendentemente difíciles. En Argo, vemos estos desafíos como una inspiración. Nos impulsan a aprovechar los avances de la última década para impulsarnos hacia una nueva era en la que el éxito comercial de los automóviles automotores será una realidad.
Estamos adoptando un enfoque pragmático para lograr automóviles totalmente automotores, incorporando el estado de la técnica y reconociendo que no hay una bala de plata. Estamos jugando el juego largo y evitamos la publicidad en nuestro compromiso de llevar esta importante tecnología a la madurez en la forma de un gran producto que gana la confianza de millones de personas en todo el mundo.
Comentarios
Publicar un comentario