Kulturudvalget 2016-17
KUU Alm.del Bilag 126
Offentligt
1740636_0001.png
LANGUAGE TECHNOLOGY IN EUROPE
FUNCTION, CHALLENGES AND
STATE OF DEVELOPMENT
HANS USZKOREIT
GERMAN RESEARCH CENTER
FOR ARTIFICIAL INTELLIGENCE
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0002.png
Language
Most knowledge of humankind is stored
and passed on in texts.
Language is the most powerful and natural
medium of communication, we have.
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0003.png
Variety
there are more than 6000 active languages
in the world, more than 2000 are written.
languages disappear at a fast rate
only a few hundred may survive
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0004.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0005.png
Europe needs multilingual LT
to preserve cultural heritage in its diversity
to give equal opportunities to all citizens of
the European Union
to make the Digital Single Market work
to benefit economically and in daily life
from the immense progress in AI and
language processing
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0006.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0007.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0008.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0009.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0010.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0011.png
Why now?
Considerable progress in
Knowledge technologies
Machine learning
Big Data
Internet technology
Hardware
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0012.png
Superhuman
Performance?
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0013.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0014.png
Paradoxon
AI cannot simulate a
four year old child.
The computer WATSON of
IBM Watson Research
Center beat the best human
quiz champions in the US TV
quiz show Jeopardy
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0015.png
Paradoxon
AI cannot understand
the simplest Joke.
But AI can now also beat
the world champion in Go
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0016.png
Yes, there is Superhuman Performance
Better than most or average people:
MT, chess, go, jeopardy, driving, face recognition
Better then most or all of the masters/pros:
chess, go, jeopardy
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0017.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0018.png
How Superhuman is Today´s AI?
statistical learning of behavior - yes
reusable knowledge – yes
inference capabilities - some
knowledge acquisition - some
intentions and planning - some
self-consciousness - no
Systems with analogy reasoning - no
Systems with sentiment/emotions - no
Systems with creativity - no
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0019.png
The difference
For solving intellectually challenging problems,
people need understanding and often creativity
AlphaGo, face recognition and autonomous driving
programs do not work by understanding
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0020.png
In machine-learned behavior: No reusable knowledge
Actually, no knowledge at all
Difference between a reactive system
and a knowledge system
No facts and no explanation
No grounding
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0021.png
Natural language interfaces and talking robots
Siri, Alexa, Google Home and many others
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0022.png
Assistants need to understand their masters
future technology will need to “understand” people
autonomous driving systems
service robots
personal assistants
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0023.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0024.png
Classical knowledge
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0025.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0026.png
Google Knowledge Graph
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0027.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0028.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0029.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0030.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0031.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0032.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0033.png
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0034.png
Recommendation
build an LT support that is similar to the one
for group 2 languages
if this is paid for by public money, make
it free to public and commercial use
support a coalition between research and
industry that promotes the LT support by
attractive sample products or services
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0035.png
Components of the Basic Structure (idea of BLARK)
Data, data and data
corpora
speech data in use situations
language models (word embeddings)
Basic processing components
speech recognition and speech synthesis
basic POS taggers and dependency parsers
dictionaries, hyphenation, morphology,
grammars
language checker
named entity recognition for places, persons, companies
KUU, Alm.del - 2016-17 - Bilag 126: Meddelelse om præsentationer fra Kulturudvalgets høring om sprogteknologi den 29. marts 2017
1740636_0036.png
THANK YOU FOR YOUR INTEREST!