×

我们使用 cookie 帮助改善 LingQ。通过浏览本网站,表示你同意我们的 cookie 政策.

image

TEDx en Español, Utilizando el poder de millones de mentes humanas | Luis von Ahn

Utilizando el poder de millones de mentes humanas | Luis von Ahn

Quiero empezar haciéndoles una pregunta:

¿Cuántos de Uds. han tenido que llenar un formulario en Internet

en el cual han tenido que ingresar unas letras distorsionadas así como estas?

OK. ¿Cuántos odian hacer eso?

Excelente. Bueno, eso lo inventé yo.

(Risas)

(Aplausos)

Eso se llama un captcha.

Es para asegurar que la entidad

que llena el formulario es un humano

y no un programa de computadora

escrito para llenar ese formulario millones de veces.

Esto funciona porque los humanos

pueden leer estos caracteres distorsionados

pero las computadoras simplemente no lo pueden hacer aún.

Por ejemplo, cuando compran boletos en Internet para algún concierto

tienen que ingresar esas letras

para asegurarse de que los revendedores no puedan comprar,

no puedan hacer un programa

que compre todos los boletos, dos a la vez.

Ahora, esos son usados por todo Internet.

Y ya que son usados tantas veces,

muchas veces la secuencia exacta de caracteres o letras escogidas al azar

es un poco desafortunada.

Por ejemplo, esto viene de Yahoo.

Las letras escogidas totalmente al azar,

en este caso fueron W, A, I, T que en inglés es una palabra, WAIT,

que significa esperar.

Pero lo mejor es que alrededor de 20 minutos después,

el email que recibió Yahoo de este usuario

["¡Ayúdenme! He estado esperando 20 m y no pasa nada"] (Risas)

Eso por supuesto no es tan malo como lo que le pasó a esta pobre persona.

[REINICIAR] (Risas)

Les puedo contar historias divertidas de captchas por horas,

pero mejor les quiero contar otro proyecto

que hicimos después de este proyecto.

Es como la evolución de los captchas. El proyecto se llama recaptcha.

Es un proyecto que empezamos en la universidad.

Lo convertimos en una compañía start-up

y después Google compró esa compañía,

así que por los próximos 5 m todo lo que les diga

es propiedad de Google. O sea que no lo repitan.

Este proyecto empezó por lo siguiente.

Resulta ser que alrededor de 200 millones de captchas son ingresados cada día.

Cuando me enteré de eso yo estaba muy orgulloso de mí mismo.

Yo pensé "miren el impacto que mi trabajo ha tenido".

Pero después me empecé a sentir mal.

No sólo son odiosos, sino además,

cada vez que alguien ingresa un captcha realmente

pierden alrededor de 10 segundos de su tiempo.

Y si multiplicamos 10 s por 200 millones llegamos a que

toda la humanidad está perdiendo alrededor de 500 000 horas diarias

ingresando captchas en Internet.

Entonces me empecé a sentir mal.

Y me puse a pensar: ¿será que existe alguna manera?

o ¿cómo podemos utilizar este esfuerzo para el bien de la humanidad?

Durante esos 10 s que alguien está ingresando un captcha

su cerebro está haciendo algo increíble.

Su cerebro está haciendo algo que las computadoras aún no pueden hacer.

Será que podemos hacer que hagan algo que sea

beneficioso para la humanidad.

¿O existe algún problema gigantesco que aún no podemos lograr

que las computadoras resuelvan

pero que podemos dividir en pedacitos chiquitos

para que cada vez que resuelva un captcha

resuelva un pedacito de ese problema?

Y resulta ser que sí y eso es lo que estamos haciendo ahora.

Hoy en día, cuando ingresamos un captcha, lo que tal vez no saben

es que no sólo están demostrando que son humanos

sino además nos están ayudando a digitalizar libros.

Déjenme explicarles cómo funciona eso.

Hay varios proyectos para digitalizar

todos los libros que han sido escritos.

Google tiene uno.

Amazon tiene otro con el Kindle.

Es así: agarran un libro.

Esas cosas físicas, las han visto, ¿verdad?

Esas cosas de ahí afuera.

(Risas)

Agarran un libro y lo escanean.

Escanear un libro consiste en tomarle una foto digital a cada página.

El próximo paso en ese proceso es que la computadora

tiene que descifrar todas las palabras que están en esa foto.

El problema es que a los libros que fueron escritos hace ya varios años,

la computadora no puede descifrar muchas de esas palabras.

Porque la tinta ya se gastó, las páginas ya se tornaron amarillas.

Entonces la palabra se ve un poquito diferente

y la computadora no la puede descifrar.

Para libros que fueron escritos hace más de 50 años

la computadora no pude descifrar alrededor del 30% de las palabras.

Entonces ahora estamos

agarrando todas las palabras que la computadora no puede descifrar

y estamos haciendo que alguien las descifre para nosotros en Internet

mientras llenan un captcha.

La próxima vez que llenen un captcha

(Aplausos)

esas palabras que están ingresando

son palabras que vienen directamente de libros que han sido digitalizados

y que la computadora no pudo reconocer.

La razón por la que ahora tenemos dos palabras en vez de una

es que necesitamos verificar si la respuesta está correcta.

Porque una de las palabras es tal que el sistema ya sabe la solución

y la otra es una que el sistema acaba de agarrar de un libro,

no sabe qué es, se la va a enseñar a algún usuario.

Le vamos a pedir al usuario que ingrese ambas.

Y no le vamos a decir cuál es cuál.

Y si ingresan la respuesta correcta,

para la cual el sistema ya sabe la respuesta,

suponemos que es un humano

y como tenemos un poco de confianza que ingresaron la otra correctamente.

Y si repetimos este proceso con 10 personas con la nueva palabra

y todos ingresan la misma cosa con la nueva palabra

tenemos mucha seguridad de que esa nueva palabra

está correctamente digitalizada.

Esa es la manera en que funciona ese sistema.

Y lo bueno es que ha sido muy exitoso.

Estamos digitalizando alrededor de 100 millones de palabras diarias.

Lo cual es el equivalente a 2 millones de libros al año

que están siendo digitalizados una palabra a la vez

por gentes escribiendo captchas en Internet.

Ahora, ya que estamos haciendo tantos pares de palabras,

también pueden pasar cosas interesantes o divertidas.

Eso es cierto porque ahora estamos enseñando dos palabras,

en inglés, una a la par de la otra, escogidas al azar.

Eso puede llevar a cosas divertidas que pasan.

Por ejemplo, enseñamos esta palabra.

Que solo es "cristianos", no tiene nada de malo.

Pero si la ponemos con otra palabra escogida totalmente al azar

pueden pasar cosas malas.

Por ejemplo, enseñamos esto. [malos cristianos]

(Risas)

Es un poco divertido.

Pero es aún peor porque hay millones de sitios,

pero resulta que este captcha lo enseñamos

en un sitio llamado La Embajada del Reino de Dios.

(Risas)

¡Ups!

Aquí hay otro muy malo.

Un político en EE. UU., JohnEdwards.com [maldito liberal]

(Risas)

Bueno, insultamos a gente todos los días con esto.

Pero no solo son insultos.

También muchas veces son cosas interesantes que pueden pasar

y eso ha dado auge a una nueva moda en Internet

en la cual han participado millones de personas

que se llama captchart o arte de captchas.

La idea es la siguiente.

Imagínense que están navegando en Internet y de repente

miran un captcha que les parece interesante.

Como éste. [tostador invisible]

Lo que tienen que hacer es tomar una captura de pantalla.

Después tienen que ingresar el captcha,

porque así nos ayudan a digitalizar libros, por favor.

Y después, lo que tienen que hacer

es dibujar algo basado en este captcha y ponerlo con el captcha, así como esto.

[tostador invisible]

(Risas)

Es un ejemplo de arte de captcha.

Ahora, hay miles de miles de esos.

Hay unos como éste, interesantes.

Hay otros como este que son más tiernos. [¡Gané!]

Y hay otros como este que son mucho más divertidos.

[Fundadores drogados] (Risas)

Este es mi nº favorito acerca de este proyecto: 900 millones.

Ese es el nº total de personas distintas

que nos han ayudado a digitalizar al menos una palabra

de algún libro a través de captchas.

Un poco más del 10 % de la humanidad

nos ha ayudado a digitalizar libros.

Son números como este los que motivan mi trabajo.

Y en particular, la pregunta que me motiva a mí es la siguiente:

Si miramos todos los proyectos más grandes de la historia de la humanidad.

Todos esos megaproyectos que ha hecho la humanidad

como las pirámides de Egipto, o el Canal de Panamá,

o poner un hombre en la Luna.

Algo curioso acerca de todos estos megaproyectos

es que fueron hechos con alrededor del mismo nº de personas.

Todos fueron hechos con alrededor de 100 000 personas.

Y nos podemos preguntar por qué es que todos usaron

el mismo nº de personas.

Y la razón es porque antes de Internet,

coordinar a más de 100 000 personas era imposible.

Pero ahora con Internet les acabo de enseñar un proyecto

donde hemos coordinado a 900 millones de personas.

Entonces la pregunta que me motiva a mí es

si podemos poner a un hombre en la luna con 100 000 personas,

¿Qué podemos hacer con 100 millones de personas?

Y con esa pregunta hemos trabajado en varios proyectos.

No les voy a contar todos.

Pero les quiero contar acerca de uno que estamos trabajando ahorita.

Llevamos alrededor de dos años trabajando en este proyecto.

Y lo vamos a lanzar en alrededor de 30 días.

Es un proyecto que se llama Duolingo.

Este proyecto empezó con la siguiente pregunta:

¿Cómo podemos hacer que 100 millones de personas

traduzcan Internet a todos los mayores idiomas, gratis?

Hablemos de esta pregunta.

La primera es traducir Internet.

Como sabemos, Internet está partido en varios idiomas.

Una gran fracción está en inglés.

Y si alguien no sabe inglés no puede usarlo

pero hay fracciones en otros idiomas

y si alguien no sabe se lo pierde.

Yo quisiera traducir todo Internet a todos los mayores idiomas.

Me gustaría.

Ahora, si eso es lo que quiero hacer mucha gente me podría decir

por qué no usamos computadoras para hacerlo.

Últimamente las computadoras están traduciendo algunas oraciones.

Pero como todos sabemos, las computadoras simplemente

no son muy buenas para traducir.

Y no lo van a ser por los próximos 20 o 30 años.

Déjenme enseñarles sólo un ejemplo de qué puede pasar

cuando traducimos algo con computadoras.

Esto es un ejemplo que encontramos en un foro en Internet acerca de...

es un foro para preguntas de programación.

Esta es una pregunta de programación que fue traducida del japonés al inglés

y de ahí la traduje al español pero mi traducción es buena.

La otra es la que es mala. Ya van a ver.

Sólo les voy a dejar que lean esto.

Está pidiendo perdón por el hecho de que es una traducción.

Esto fue hecho con el mejor programa de traducción

de japonés a inglés.

Recuerden. Se supone que es una pregunta acerca de programación.

Aquí viene el preámbulo de la pregunta.

[A menudo, la cabra durante la instalación de un error es vomitar] (Risas)

Después viene la primera parte de la pregunta.

[¿Cuántas veces como el viento, un poste, y el dragón?] (Risas)

Después viene mi parte favorita de la pregunta.

[¿Este insulto a las piedras de mi padre?] (Risas)

Y después viene mi parte favorita de todo el mensaje.

[Por favor, pedir disculpas por su estupidez. Hay muchos gracias]

O sea que, las computadoras no son muy buenas

así que necesitamos humanos.

Entonces lo que yo quiero hacer es que 100 millones de personas

traduzcan Internet a todos los mayores idiomas y gratis.

No creo que le pueda pagar yo a 100 millones de personas.

Entonces quiero que lo hagan gratis.

Si eso es lo que quiero hacer,

cuando empezamos a trabajar en este proyecto nos dimos cuenta

de que había dos grandes obstáculos para lograr hacer esto.

El primero es la falta de personas bilingües.

Yo no sé si existen 100 millones de personas que usan Internet

que son suficientemente bilingües para ayudarnos a traducir.

Ese es un gran problema.

El segundo es la falta de motivación.

¿Cómo vamos a hacer para motivar a personas para que traduzcan gratis?

Después de pensar en esos dos problemas por varios meses,

nos dimos cuenta que había una manera

de resolver ambos problemas con la misma solución.

Nos dimos cuenta que había una manera de matar dos pájaros de un tiro.

Y la manera es transformar la traducción de idiomas

en algo que millones de personas quieren hacer

y que además ayuda con el problema de falta de personas bilingües.

Y eso es el aprendizaje de otros idiomas.

Hay millones de personas que quieren aprender otros idiomas.

Hoy en día hay 1200 millones de personas en el mundo aprendiendo otro idioma.

No sólo es porque los están forzando a hacerlo en el colegio.

En EE. UU., por ejemplo, hay más de 5 millones de personas

que han pagado más de 500 dólares por programas de computación

para aprender nuevos idiomas.

Mucha gente quiere aprender nuevos idiomas.

Entonces hemos estado trabajando en los últimos dos años

es un nuevo sitio de Internet que se llama Duolingo.

La idea es que la gente puede aprender un nuevo idioma,

100 % gratis, y al mismo tiempo, están traduciendo Internet.

O sea, aprenden traduciendo.

Esa es la manera en que funciona.

Y la manera en que funciona es que cuando están empezando

les vamos a dar oraciones muy sencillas de Internet.

Y si no saben alguna palabra les vamos a decir qué significa,

pero les vamos a decir "traduzca esta oración".

Y resulta ser que la gente sí lo puede hacer.

Aunque no sepan nada del idioma si les explicamos

qué significa cada palabra y la van a traducir.

Y después van a ver cómo otras personas traducen

la misma oración y así aprende cómo se traduce.

Y después que van usando el sitio

les vamos a ir dando oraciones más y más complejas.

Y así nos van a ir ayudando a traducir. Así es como funciona el sitio.

Ahora ya terminamos de construirlo

y lo que estamos haciendo ahora es sólo probándolo.

Cuando empezamos a trabajar en esto

yo no pensé que fuera a funcionar, la verdad.

Pero resulta ser que sí funciona. Y es increíble.

En primer lugar la gente aprende idiomas.

En este caso estamos probándolo con personas

que saben inglés y aprenden español.

Y al revés.

Y resulta ser que aprenden el idioma muy bien.

Lo aprenden tan bien como con cualquier otro método computarizado

de aprender idiomas.

Lo cual es muy bueno. Pero aún más increíble las traducciones

que nos está dando la gente a la hora que están aprendiendo son muy buenas.

Es más son tan buenas como las traducciones

que nos dan traductores profesionales.

Ahora, hay un truco que estamos usando para esto

y es que cada oración la traducen varias personas, varios estudiantes,

y escogemos la mejor. Pero resulta ser que esa mejor

es tan buena como la que nos da un traductor profesional.

Pero además de que a cada oración la está traduciendo muchas personas,

otra cosa que es buena es que con Duolingo

podemos traducir realmente bastante rápido.

Déjenme darles un estimado de qué tan rápido podemos traducir.

Si quisiéramos traducir la Wikipedia del inglés al español

-la Wikipedia existe en español pero es mucho más pequeña

que en inglés, es alrededor del 20 % del tamaño en inglés-

si quisiéramos traducir la Wikipedia del inglés al español con Duolingo,

si tuviéramos 100 000 usuarios aprendiendo inglés con Duolingo

podríamos hacerlo en 5 semanas.

Y con un millón de usuarios podríamos hacerlo en 80 horas.

Y ya que todos mis proyectos hasta la fecha han logrado

tener más de un millón de personas

esperamos que podamos traducir todo Internet gratis.

No hemos lanzado Duolingo.

(Aplausos)

No hemos lanzado Duolingo pero lo vamos a hacer como en 30 días.

Si van a Duolingo.com los vamos a dejar

entrar al beta privado en alrededor de 30 días.

Ayúdennos.

Gracias.

(Aplausos)

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

Utilizando el poder de millones de mentes humanas | Luis von Ahn nutzen||Macht||Millionen||Geister|human|Luis|von| |||||||||of|de Die Kraft von Millionen von Köpfen nutzen | Luis von Ahn Harnessing the power of millions of human minds | Luis von Ahn Utiliser la puissance de millions d'esprits humains | Luis von Ahn Usare la potenza di milioni di menti umane | Luis von Ahn 何百万という人間の心の力を使って|ルイス・フォン・アン Wykorzystanie mocy milionów ludzkich umysłów | Luis von Ahn Usando o poder de milhões de mentes humanas | Luis von Ahn Используя силу миллионов человеческих умов | Луис фон Ан Med hjälp av kraften i miljontals mänskliga hjärnor - Luis von Ahn Використовуючи силу мільйонів людських умів | Луїс фон Ан

Quiero empezar haciéndoles una pregunta: |begin|ihnen|eine|Frage ||by doing them|| ||fazendo-lhes|| Ich möchte Ihnen zunächst eine Frage stellen: I want to start by asking you a question: Ik wil beginnen met je een vraag te stellen: Quero começar fazendo uma pergunta:

¿Cuántos de Uds. han tenido que llenar un formulario en Internet ||||hatten||ausfüllen|||| ||you all||||to fill||form|| ||||||||formulário|| Wie viele von Ihnen mussten ein Formular im Internet ausfüllen? How many of you have had to fill out a form on the Internet Quantos de vocês tiveram que preencher um formulário na Internet

en el cual han tenido que ingresar unas letras distorsionadas así como estas? |||||||||zkreslené||| ||||||eingeben|||verzerrte||| ||||||enter|||distorted|like this|like| |||||||||distorcidas||| in denen sie solche verzerrten Buchstaben eingeben mussten? in which they have had to enter some distorted letters like this? waarin ze op deze manier enkele vervormde letters hebben moeten invoeren? em que eles tiveram que inserir algumas letras distorcidas como esta?

OK. ¿Cuántos odian hacer eso? ||hassen|| |How many|hate|| ||odiantes|| IN ORDNUNG. Wie viele hassen es, das zu tun? OK. How many hate to do that?

Excelente. Bueno, eso lo inventé yo. |Good|||I invented|I ||||eu inventei| Ausgezeichnet. Nun, ich habe das erfunden. Excellent. Well, I made that up. Uitstekend. Nou, dat heb ik verzonnen.

(Risas)

(Aplausos)

Eso se llama un captcha. ||||captcha ||||captcha ||||captcha This is called a captcha. Isso é chamado de captcha.

Es para asegurar que la entidad |||||entita |||||Entität ||to ensure|||entity Es ist sicherzustellen, dass die Entität It is to ensure that the entity É para garantir que a entidade

que llena el formulario es un humano |||form||| who fills out the form is a human

y no un programa de computadora |||||Computer and not a computer program

escrito para llenar ese formulario millones de veces. ||to fill||||| written to fill out that form millions of times. escrito para preencher esse formulário milhões de vezes.

Esto funciona porque los humanos This works because humans

pueden leer estos caracteres distorsionados ||||distorted ||||distorcidos can read these distorted characters

pero las computadoras simplemente no lo pueden hacer aún. ||||||||noch ||computers|||||| aber Computer können das einfach noch nicht. but computers simply can't do it yet. mas os computadores ainda não conseguem fazer isso.

Por ejemplo, cuando compran boletos en Internet para algún concierto ||||Tickets||||| ||||tickets||||| |||compram|ingressos||||| Zum Beispiel, wenn sie Karten für ein Konzert im Internet kaufen Por exemplo, quando compram ingressos para um show na Internet

tienen que ingresar esas letras ||enter|| diese Buchstaben eingeben müssen

para asegurarse de que los revendedores no puedan comprar, |||||přeprodejci||| |to ensure||||resellers||| |||||revendedores|||

no puedan hacer un programa

que compre todos los boletos, dos a la vez. ||||||ein|| ||||tickets|||| to buy all the tickets, two at a time.

Ahora, esos son usados por todo Internet. |||used||| |||usados|||

Y ya que son usados tantas veces, ||that|are|||times And since they are used so many times,

muchas veces la secuencia exacta de caracteres o letras escogidas al azar |||||||||ausgewählten||Zufall |||sequence||||||chosen||random |||||||||||ao acaso many times the exact sequence of characters or letters chosen at random muitas vezes a sequência exata de caracteres ou letras escolhidas aleatoriamente

es un poco desafortunada. |||unglücklich |||unfortunate |||infeliz it's a bit unfortunate.

Por ejemplo, esto viene de Yahoo. |||||Yahoo |||||Yahoo |||||Yahoo

Las letras escogidas totalmente al azar, ||chosen|totally||random

en este caso fueron W, A, I, T que en inglés es una palabra, WAIT, ||||Č||||||||||čekat ||||E||||||||||ESPERA ||||||||||||||esperar

que significa esperar. ||warten which means to wait.

Pero lo mejor es que alrededor de 20 minutos después, |||||ungefähr||| But the best part is that about 20 minutes later, Mas a melhor coisa é que cerca de 20 minutos depois,

el email que recibió Yahoo de este usuario |e-mail|||||| |||||||Benutzer |||||||user the email Yahoo received from this user

["¡Ayúdenme! He estado esperando 20 m y no pasa nada"] (Risas) Pomozte mi||||minutos||||| Help me|||||||||Laughs [Help me! I've been waiting for 20 m and nothing happens"] (laughs).

Eso por supuesto no es tan malo como lo que le pasó a esta pobre persona. ||natürlich||||||||||||| That of course is not as bad as what happened to this poor person. Dat is natuurlijk niet zo erg als wat er met deze arme persoon is gebeurd.

[REINICIAR] (Risas) Restart| NEU STARTEN| RESTART| REINICIAR(1)|

Les puedo contar historias divertidas de captchas por horas, ||||||captchas|| ||||||capchas|| ||||||captchas|| I can tell you funny stories about captchas for hours,

pero mejor les quiero contar otro proyecto ||||erzählen|| ||||to tell|| but I would rather tell you about another project

que hicimos después de este proyecto. that we did after this project.

Es como la evolución de los captchas. El proyecto se llama recaptcha. |||||||||||recaptcha |||evolution|||capchas|||||recaptcha |||||||||||recaptcha(1) Het is als de evolutie van captcha's. Het project heet recaptcha.

Es un proyecto que empezamos en la universidad.

Lo convertimos en una compañía start-up |||||start-up|nová |we converted||||comenzamos| |nós convertimos||||de start-up|

y después Google compró esa compañía, |||bought||

así que por los próximos 5 m todo lo que les diga ||||následujících|||||| ||||||||||sage so||||||todo|it|that||say also für die nächsten 5 Jahre alles, was ich ihnen sage so for the next 5 m everything I say to them

es propiedad de Google. O sea que no lo repitan. |||||||||wiederholen |property||||that is||||repeat ist Eigentum von Google, also wiederholen Sie es nicht. is owned by Google. So don't repeat it. is eigendom van Google. Herhaal het dus niet.

Este proyecto empezó por lo siguiente. |||||next Dieses Projekt wurde aus folgendem Grund gestartet. This project started because of the following.

Resulta ser que alrededor de 200 millones de captchas son ingresados cada día. |||||||||zadány|| resulta|||||||||eingegeben|| |||||||||entered|| |||||||||inseridos|| Jeden Tag werden rund 200 Millionen Captchas eingegeben.

Cuando me enteré de eso yo estaba muy orgulloso de mí mismo. ||erfuhr||||||||| ||||||||proud||| Als ich davon erfuhr, war ich sehr stolz auf mich. When I found that out I was very proud of myself.

Yo pensé "miren el impacto que mi trabajo ha tenido". ||sehen||||||| |||||||||had Ich dachte: "Seht euch an, was meine Arbeit bewirkt hat".

Pero después me empecé a sentir mal. |||begann||| |||I started||| Aber dann begann ich mich schlecht zu fühlen.

No sólo son odiosos, sino además, ||||son|außerdem |only||hateful|but|besides |||odiosos|| Sie sind nicht nur hasserfüllt, sie sind hasserfüllt, They are not only obnoxious, but also,

cada vez que alguien ingresa un captcha realmente |||someone|enters||| ||||insere||| jedes Mal, wenn jemand ein Captcha eingibt, wird er tatsächlich

pierden alrededor de 10 segundos de su tiempo. they lose|||||| verlieren etwa 10 Sekunden ihrer Zeit.

Y si multiplicamos 10 s por 200 millones llegamos a que ||multiplicamos|||||| ||multiplicamos(1)||||||

toda la humanidad está perdiendo alrededor de 500 000 horas diarias ||||||||täglich ||||||||daily ||||||||diárias

ingresando captchas en Internet. eingeben||| entering||| digitando|||

Entonces me empecé a sentir mal. Dann||||| ||I started||| Dann begann ich mich schlecht zu fühlen.

Y me puse a pensar: ¿será que existe alguna manera? ||ich begann|||||||Art |to me|I put||to think||||| Und ich begann zu überlegen: Gibt es eine Möglichkeit?

o ¿cómo podemos utilizar este esfuerzo para el bien de la humanidad? |||||Anstrengung|||||| |||||effort|||||| oder wie können wir diese Bemühungen zum Wohle der Menschheit nutzen?

Durante esos 10 s que alguien está ingresando un captcha ||||||entering|| Während der 10 Sekunden, in denen jemand ein Captcha eingibt

su cerebro está haciendo algo increíble. |Gehirn|||etwas|unglaublich his|brain|||| Ihr Gehirn macht etwas Unglaubliches.

Su cerebro está haciendo algo que las computadoras aún no pueden hacer. Ihr Gehirn leistet etwas, was Computer noch nicht können.

Será que podemos hacer que hagan algo que sea wird|||||wir sie dazu bringen||| Können wir sie dazu bringen, etwas zu tun, das Can we get them to do something that is

beneficioso para la humanidad. zum Nutzen der Menschheit.

¿O existe algún problema gigantesco que aún no podemos lograr ||||||noch|||erreichen ||||gigantic||still|||achieve Oder gibt es ein gigantisches Problem, das wir noch nicht lösen können? Or is there some gigantic problem that we cannot yet solve?

que las computadoras resuelvan |||lösen |||solve |||resolvam Computer zu lösen

pero que podemos dividir en pedacitos chiquitos |||||little pieces|kleine ||we can|to divide||little pieces|small |||dividir||pedacinhos| die wir aber in winzige Teile zerlegen können

para que cada vez que resuelva un captcha |||||resolver|| so dass Sie jedes Mal, wenn Sie ein Captcha auflösen

resuelva un pedacito de ese problema? ||little piece||| dieses Problem ein wenig lösen?

Y resulta ser que sí y eso es lo que estamos haciendo ahora.

Hoy en día, cuando ingresamos un captcha, lo que tal vez no saben heute|||||||||solamente|vielleicht||wissen ||||we enter|||||||| ||||digitamos|||||||| Wenn wir heutzutage ein Captcha eingeben, wissen Sie vielleicht nicht Nowadays, when we enter a captcha, what you may not know

es que no sólo están demostrando que son humanos |||||showing||| ist, dass sie nicht nur beweisen, dass sie Menschen sind is that you are not only proving that you are human

sino además nos están ayudando a digitalizar libros. ||||||digitalisieren| but||||||digitize| ||||||digitalizar livros| aber sie helfen uns auch bei der Digitalisierung von Büchern. but you are also helping us to digitize books.

Déjenme explicarles cómo funciona eso. Lasst mich|erklären||| Let me|to them||| deixem-me|explicar a vocês|||

Hay varios proyectos para digitalizar ||projects||digitize

todos los libros que han sido escritos. ||||||written

Google tiene uno.

Amazon tiene otro con el Kindle. |||||Kindle |||||Kindle Amazon|||||

Es así: agarran un libro. ||nehmen|| ||they grab|| It's like this: they grab a book.

Esas cosas físicas, las han visto, ¿verdad? ||physical|||| Sie haben diese physischen Dinge gesehen, nicht wahr?

Esas cosas de ahí afuera. |||da draußen|draußen Diese Dinge da draußen. Those things out there.

(Risas) (lacht)

Agarran un libro y lo escanean. |||||scannen They grab|||||scan |||||escaneiam

Escanear un libro consiste en tomarle una foto digital a cada página. |||besteht||ein Foto machen|||||| Scan|||||to take it||||||page Escanear um|||||tirar uma||||||

El próximo paso en ese proceso es que la computadora |||||process||||

tiene que descifrar todas las palabras que están en esa foto. |||||Wörter||||| ||decrypt|||||||| ||decifrar||||||||

El problema es que a los libros que fueron escritos hace ya varios años,

la computadora no puede descifrar muchas de esas palabras. ||||to decipher||||

Porque la tinta ya se gastó, las páginas ya se tornaron amarillas. ||||se|vyčerpala|||||ztmavly| ||Tinte|||verbrauchte|||||wurden|gelb ||ink|||was spent|||||turned|yellow |||||acabou|||||tornaram-se|

Entonces la palabra se ve un poquito diferente ||||sieht||ein bisschen|

y la computadora no la puede descifrar. ||||||decrypt

Para libros que fueron escritos hace más de 50 años

la computadora no pude descifrar alrededor del 30% de las palabras. konnte der Computer etwa 30 % der Wörter nicht entziffern.

Entonces ahora estamos Jetzt sind wir also

agarrando todas las palabras que la computadora no puede descifrar greifend||||||||| grabbing||||||||| alle Wörter zu erfassen, die der Computer nicht entziffern kann

y estamos haciendo que alguien las descifre para nosotros en Internet ||||||decode|||| ||||||decifre||||

mientras llenan un captcha. während|füllen|| |preenchem||

La próxima vez que llenen un captcha ||||they fill|| ||||preencherem||

(Aplausos)

esas palabras que están ingresando ||||entering

son palabras que vienen directamente de libros que han sido digitalizados ||||||||have||digitized ||||||||||digitalizados

y que la computadora no pudo reconocer. |||||konnte|

La razón por la que ahora tenemos dos palabras en vez de una

es que necesitamos verificar si la respuesta está correcta.

Porque una de las palabras es tal que el sistema ya sabe la solución

y la otra es una que el sistema acaba de agarrar de un libro, ||||||||endet||ergreifen||| |the|||||||||grab||| and the other is one that the system just grabbed from a book,

no sabe qué es, se la va a enseñar a algún usuario. ||||||||zeigen|||Benutzer nicht weiß, was es ist, wird er es einem Nutzer zeigen. he does not know what it is, he is going to show it to some user.

Le vamos a pedir al usuario que ingrese ambas. |||bitten||||eingeben|beide |||||||enter| |||||||insira| Wir werden den Benutzer auffordern, beides einzugeben. We will ask the user to enter both.

Y no le vamos a decir cuál es cuál. Und wir werden Ihnen nicht sagen, was was ist.

Y si ingresan la respuesta correcta, ||they enter||| ||eles inserem|||

para la cual el sistema ya sabe la respuesta,

suponemos que es un humano wir nehmen an|||| we assume|||| supomos||||

y como tenemos un poco de confianza que ingresaron la otra correctamente. ||||||Vertrauen||||| ||||||||they entered||| ||||||||entraram|||

Y si repetimos este proceso con 10 personas con la nueva palabra ||repetimos||||||||

y todos ingresan la misma cosa con la nueva palabra ||enter|||||||

tenemos mucha seguridad de que esa nueva palabra

está correctamente digitalizada. ||digitized ||digitalizada

Esa es la manera en que funciona ese sistema.

Y lo bueno es que ha sido muy exitoso. ||||||||erfolgreich ||||||||successful ||||||||bem-sucedido

Estamos digitalizando alrededor de 100 millones de palabras diarias. |digitizing|||||| |digitalizando||||||

Lo cual es el equivalente a 2 millones de libros al año ||||equivalent||||||

que están siendo digitalizados una palabra a la vez

por gentes escribiendo captchas en Internet. |people||||

Ahora, ya que estamos haciendo tantos pares de palabras, ||||||pairs||words

también pueden pasar cosas interesantes o divertidas.

Eso es cierto porque ahora estamos enseñando dos palabras,

en inglés, una a la par de la otra, escogidas al azar. |||||||||chosen||random

Eso puede llevar a cosas divertidas que pasan.

Por ejemplo, enseñamos esta palabra.

Que solo es "cristianos", no tiene nada de malo. That is just "Christians", there is nothing wrong with it.

Pero si la ponemos con otra palabra escogida totalmente al azar |||||||chosen|||random |||||||escolhida||| But if we put it with another word chosen completely at random

pueden pasar cosas malas. bad things can happen.

Por ejemplo, enseñamos esto. [malos cristianos]

(Risas)

Es un poco divertido.

Pero es aún peor porque hay millones de sitios,

pero resulta que este captcha lo enseñamos but||||||

en un sitio llamado La Embajada del Reino de Dios. |||||Embassy|||| |||||Embaixada||||

(Risas)

¡Ups! Oups Oops ops

Aquí hay otro muy malo.

Un político en EE. UU., JohnEdwards.com [maldito liberal] |||||John Edwards||prokletý| |||||John Edwards||| |||||John Edwards|||

(Risas)

Bueno, insultamos a gente todos los días con esto. |we insult||||||| |insultamos||||||| Well, we insult people every day with this.

Pero no solo son insultos. ||||insultos

También muchas veces son cosas interesantes que pueden pasar

y eso ha dado auge a una nueva moda en Internet ||to dalo||rozmach|||||| ||||boom||||||

en la cual han participado millones de personas ||||participado|||

que se llama captchart o arte de captchas. |||captchart|||| |||captcha art|||| |||captchart(1)||||

La idea es la siguiente.

Imagínense que están navegando en Internet y de repente |||navegando|||||

miran un captcha que les parece interesante.

Como éste. [tostador invisible] ||toaster| ||tostador invisível|

Lo que tienen que hacer es tomar una captura de pantalla. ||||||||snímek obrazovky|| ||||||||||screen

Después tienen que ingresar el captcha,

porque así nos ayudan a digitalizar libros, por favor.

Y después, lo que tienen que hacer

es dibujar algo basado en este captcha y ponerlo con el captcha, así como esto. |to draw||||||||||||| ||||||||colocá-lo||||||

[tostador invisible] toaster|

(Risas)

Es un ejemplo de arte de captcha.

Ahora, hay miles de miles de esos.

Hay unos como éste, interesantes.

Hay otros como este que son más tiernos. [¡Gané!] ||||||||Vyhrál jsem |||||||affectionate|I won |||||||carinhosos| Er zijn anderen zoals deze die malser zijn. [Ik win!]

Y hay otros como este que son mucho más divertidos.

[Fundadores drogados] (Risas) zakladatelé|| Founders|drunk| |drogados|

Este es mi nº favorito acerca de este proyecto: 900 millones. |||number|||||| |||número||||||

Ese es el nº total de personas distintas

que nos han ayudado a digitalizar al menos una palabra

de algún libro a través de captchas. of a book through captchas.

Un poco más del 10 % de la humanidad

nos ha ayudado a digitalizar libros.

Son números como este los que motivan mi trabajo. ||||||motivam||

Y en particular, la pregunta que me motiva a mí es la siguiente:

Si miramos todos los proyectos más grandes de la historia de la humanidad.

Todos esos megaproyectos que ha hecho la humanidad ||megaprojekty||||| ||megaprojects||||| ||megaprojetos|||||

como las pirámides de Egipto, o el Canal de Panamá, ||||Egito|||||

o poner un hombre en la Luna. |||man|||

Algo curioso acerca de todos estos megaproyectos

es que fueron hechos con alrededor del mismo nº de personas. ||were|made|||||||

Todos fueron hechos con alrededor de 100 000 personas.

Y nos podemos preguntar por qué es que todos usaron

el mismo nº de personas. ||number||

Y la razón es porque antes de Internet,

coordinar a más de 100 000 personas era imposible.

Pero ahora con Internet les acabo de enseñar un proyecto ||with||||||| But now with the Internet I have just shown you a project

donde hemos coordinado a 900 millones de personas. ||koordinováno|||| ||coordinated|||| ||coordenado||||

Entonces la pregunta que me motiva a mí es

si podemos poner a un hombre en la luna con 100 000 personas, ||||||||moon||

¿Qué podemos hacer con 100 millones de personas?

Y con esa pregunta hemos trabajado en varios proyectos. |||||trabalhado|||

No les voy a contar todos.

Pero les quiero contar acerca de uno que estamos trabajando ahorita. But I want to tell you about one we are working on right now.

Llevamos alrededor de dos años trabajando en este proyecto. We have||||||||

Y lo vamos a lanzar en alrededor de 30 días. ||||to launch|||| ||||lançar||||

Es un proyecto que se llama Duolingo. ||||||Duolingo

Este proyecto empezó con la siguiente pregunta:

¿Cómo podemos hacer que 100 millones de personas

traduzcan Internet a todos los mayores idiomas, gratis? translate|||||||free

Hablemos de esta pregunta.

La primera es traducir Internet.

Como sabemos, Internet está partido en varios idiomas. As we know, the Internet is split into several languages.

Una gran fracción está en inglés. ||velká část||| ||grande parte|||

Y si alguien no sabe inglés no puede usarlo

pero hay fracciones en otros idiomas ||fractions||| ||frações|||

y si alguien no sabe se lo pierde.

Yo quisiera traducir todo Internet a todos los mayores idiomas.

Me gustaría.

Ahora, si eso es lo que quiero hacer mucha gente me podría decir

por qué no usamos computadoras para hacerlo.

Últimamente las computadoras están traduciendo algunas oraciones.

Pero como todos sabemos, las computadoras simplemente

no son muy buenas para traducir.

Y no lo van a ser por los próximos 20 o 30 años. And they won't be for the next 20 to 30 years.

Déjenme enseñarles sólo un ejemplo de qué puede pasar Let me||||||||

cuando traducimos algo con computadoras. |traduzimos|||

Esto es un ejemplo que encontramos en un foro en Internet acerca de... ||||||||forum|||| ||||||||fórum||||

es un foro para preguntas de programación. ||||||programming ||||||programação

Esta es una pregunta de programación que fue traducida del japonés al inglés ||||||||translated|||| ||||||||traduzida||||

y de ahí la traduje al español pero mi traducción es buena. ||||I translated||||||| ||||traduzi|||||||

La otra es la que es mala. Ya van a ver. The other is the one that is bad. You will see.

Sólo les voy a dejar que lean esto. ||||||read|

Está pidiendo perdón por el hecho de que es una traducción. U verontschuldigt zich voor het feit dat het een vertaling is.

Esto fue hecho con el mejor programa de traducción

de japonés a inglés.

Recuerden. Se supone que es una pregunta acerca de programación. Remember|||||||||

Aquí viene el preámbulo de la pregunta. |||úvod||| |||preamble||| |||preambulo|||

[A menudo, la cabra durante la instalación de un error es vomitar] (Risas) |often||goat||||||||to vomit| ||||||instalação|||||| [Often, the goat during the installation of an error is to vomit] (laughs)

Después viene la primera parte de la pregunta. Then comes the first part of the question.

[¿Cuántas veces como el viento, un poste, y el dragón?] (Risas) ||||||sloup|||| ||||||post|||dragon|Laughs ||||||poste|||dragão| [How many times like the wind, a pole, and the dragon?] (laughs)

Después viene mi parte favorita de la pregunta.

[¿Este insulto a las piedras de mi padre?] (Risas) |insulto||||||| [This insult to my father's stones?] (laughs)

Y después viene mi parte favorita de todo el mensaje.

[Por favor, pedir disculpas por su estupidez. Hay muchos gracias] ||||||stupidity||| ||||||estupidez|||

O sea que, las computadoras no son muy buenas

así que necesitamos humanos.

Entonces lo que yo quiero hacer es que 100 millones de personas

traduzcan Internet a todos los mayores idiomas y gratis.

No creo que le pueda pagar yo a 100 millones de personas.

Entonces quiero que lo hagan gratis. Then I want them to do it for free.

Si eso es lo que quiero hacer,

cuando empezamos a trabajar en este proyecto nos dimos cuenta ||||||||we realized|

de que había dos grandes obstáculos para lograr hacer esto. that there were two major obstacles to achieving this.

El primero es la falta de personas bilingües. The first is the lack of bilingual people.

Yo no sé si existen 100 millones de personas que usan Internet I don't know if there are 100 million people using the Internet.

que son suficientemente bilingües para ayudarnos a traducir. that|||||||

Ese es un gran problema.

El segundo es la falta de motivación.

¿Cómo vamos a hacer para motivar a personas para que traduzcan gratis?

Después de pensar en esos dos problemas por varios meses,

nos dimos cuenta que había una manera

de resolver ambos problemas con la misma solución. to solve both problems with the same solution.

Nos dimos cuenta que había una manera de matar dos pájaros de un tiro. Ci siamo resi conto che c'era un modo per prendere due piccioni con una fava.

Y la manera es transformar la traducción de idiomas

en algo que millones de personas quieren hacer

y que además ayuda con el problema de falta de personas bilingües.

Y eso es el aprendizaje de otros idiomas.

Hay millones de personas que quieren aprender otros idiomas.

Hoy en día hay 1200 millones de personas en el mundo aprendiendo otro idioma.

No sólo es porque los están forzando a hacerlo en el colegio. ||||||forcing||||| ||||||forçando|||||

En EE. UU., por ejemplo, hay más de 5 millones de personas

que han pagado más de 500 dólares por programas de computación |||||||programy|| ||paid|||||||computing

para aprender nuevos idiomas.

Mucha gente quiere aprender nuevos idiomas.

Entonces hemos estado trabajando en los últimos dos años So we have been working for the last two years

es un nuevo sitio de Internet que se llama Duolingo.

La idea es que la gente puede aprender un nuevo idioma,

100 % gratis, y al mismo tiempo, están traduciendo Internet. ||||||translating|

O sea, aprenden traduciendo.

Esa es la manera en que funciona.

Y la manera en que funciona es que cuando están empezando

les vamos a dar oraciones muy sencillas de Internet. we are going to give you very simple sentences from the Internet.

Y si no saben alguna palabra les vamos a decir qué significa,

pero les vamos a decir "traduzca esta oración". |||||translate|| |||||traduza||

Y resulta ser que la gente sí lo puede hacer.

Aunque no sepan nada del idioma si les explicamos ||they know||||||

qué significa cada palabra y la van a traducir.

Y después van a ver cómo otras personas traducen ||||||||they translate

la misma oración y así aprende cómo se traduce.

Y después que van usando el sitio

les vamos a ir dando oraciones más y más complejas. ||||giving|||||

Y así nos van a ir ayudando a traducir. Así es como funciona el sitio.

Ahora ya terminamos de construirlo ||||it ||||construí-lo

y lo que estamos haciendo ahora es sólo probándolo. ||||||||testing it ||||||||testando isso

Cuando empezamos a trabajar en esto

yo no pensé que fuera a funcionar, la verdad.

Pero resulta ser que sí funciona. Y es increíble.

En primer lugar la gente aprende idiomas.

En este caso estamos probándolo con personas ||||trying it||

que saben inglés y aprenden español.

Y al revés. ||upside down

Y resulta ser que aprenden el idioma muy bien.

Lo aprenden tan bien como con cualquier otro método computarizado |||||||||computerized |||||||||computadorizado

de aprender idiomas.

Lo cual es muy bueno. Pero aún más increíble las traducciones Which is very good. But even more amazing are the translations

que nos está dando la gente a la hora que están aprendiendo son muy buenas. |||giving|||||||||||

Es más son tan buenas como las traducciones

que nos dan traductores profesionales. |||translators| ||||profissionais that we get from professional translators.

Ahora, hay un truco que estamos usando para esto |||trick||||| Now, there's a trick we're using for this

y es que cada oración la traducen varias personas, varios estudiantes,

y escogemos la mejor. Pero resulta ser que esa mejor |we choose||||||||

es tan buena como la que nos da un traductor profesional. |||||||||translator|

Pero además de que a cada oración la está traduciendo muchas personas,

otra cosa que es buena es que con Duolingo

podemos traducir realmente bastante rápido.

Déjenme darles un estimado de qué tan rápido podemos traducir. Let me||||||||| |||orçamento||||||

Si quisiéramos traducir la Wikipedia del inglés al español |we would like||||||| ||||Wikipedia||||

-la Wikipedia existe en español pero es mucho más pequeña

que en inglés, es alrededor del 20 % del tamaño en inglés- |||||||size||

si quisiéramos traducir la Wikipedia del inglés al español con Duolingo, |we would like|||||||||

si tuviéramos 100 000 usuarios aprendiendo inglés con Duolingo if we had 100,000 users learning English with Duolingo

podríamos hacerlo en 5 semanas. we could do it in 5 weeks.

Y con un millón de usuarios podríamos hacerlo en 80 horas. And with one million users we could do it in 80 hours.

Y ya que todos mis proyectos hasta la fecha han logrado And since all my projects to date have been successful, I have been able to

tener más de un millón de personas have more than one million people

esperamos que podamos traducir todo Internet gratis.

No hemos lanzado Duolingo. ||launched| We have not launched Duolingo.

(Aplausos)

No hemos lanzado Duolingo pero lo vamos a hacer como en 30 días. We haven't launched Duolingo but we are going to do it in about 30 days.

Si van a Duolingo.com los vamos a dejar

entrar al beta privado en alrededor de 30 días. to enter||||||| ||beta(1) privado|||||

Ayúdennos. Help us Ajude-nos

Gracias. Thank you

(Aplausos)