En camino hacia la ética y los estándares de las máquinas
Jiang, L. y col. (2022).
ArXiv, abs / 2110.07574.
¿Qué tienes que enseñarle a una máquina a comportarse de forma ética? Si bien las reglas éticas generales parecen simples de formular («no matarás»), aplicar tales reglas a situaciones reales es mucho más complejo. Por ejemplo, mientras que «ayudar a un amigo» es generalmente algo bueno, «ayudar a un amigo a difundir noticias falsas» no lo es. Identificamos cuatro desafíos fundamentales para la ética y las normas de las máquinas: (1) una comprensión de las reglas morales y las normas sociales; (2) la capacidad de percibir situaciones reales visualmente o leyendo descripciones en lenguaje natural; (3) razonamiento razonable para anticipar el resultado de acciones alternativas en diferentes contextos; (4) Sobre todo, la capacidad de emitir juicios éticos en vista de la interacción entre valores en competencia y su justificación en diferentes contextos (por ejemplo, el derecho a la libertad de expresión frente a la prevención de la difusión de noticias falsas).
Nuestro artículo comienza a abordar estas cuestiones en el marco del paradigma del aprendizaje profundo. Nuestro modelo prototipo Delphi muestra una gran promesa para el razonamiento moral razonable basado en el habla con una precisión verificada por humanos de hasta el 92,1%. Esto está en marcado contraste con el rendimiento de disparo cero de GPT-3 del 52,3%, lo que sugiere que el escalado masivo por sí solo no imparte valores humanos a los modelos de lenguaje neuronal previamente entrenados. Por ejemplo, presentamos el Commonsense Norm Bank, un libro de texto moral elaborado a medida que recopila 1,7 millones de ejemplos de juicios éticos de personas en una amplia gama de situaciones cotidianas. Además de los nuevos recursos y servicios básicos para la investigación futura, nuestro estudio proporciona nuevos conocimientos que conducen a varias preguntas de investigación abiertas importantes: la distinción entre valores humanos universales y valores personales, el modelado de diferentes marcos morales y enfoques coherentes y explicables. a la ética de las máquinas.
Desde el fondo
El impresionante logro de Delphi en el razonamiento moral de las máquinas en diversas situaciones de composición del mundo real subraya la importancia de desarrollar conjuntos de datos de alta calidad comentados por humanos para los juicios morales humanos. Finalmente, a través de una investigación sistemática, mostramos que Delphi todavía está lidiando con situaciones que varían de un momento a otro o de culturas, así como con situaciones que tienen un impacto en los sesgos sociales y demográficos. Discutimos las capacidades y limitaciones de Delphi en este documento e identificamos las direcciones clave de la ética de las máquinas para el trabajo futuro. Esperamos que nuestro trabajo abra importantes vías para la investigación futura en el campo emergente de la ética de las máquinas, y alentamos a nuestra comunidad de investigadores a unir fuerzas para abordar estos desafíos de investigación.