Institut für Informationssysteme
Technische Universität Braunschweig
Building and Managing Knowledge Graphs
Jan-Christoph Kalo and Wolf-Tilo Balke
What is a Knowledge Graph?
• Knowledge graphs are structured information repositories
– They contain entity-centric knowledge
• Knowledge graphs support several applications
– Web search, question answering, machine reading, recommendation
Representing Knowledge as a Graph
Braunschweig Niedersachsen 3 Hannover
1946 Ulrich Markuth
248.292
gegründet
Landeshauptstadt
Bundesland Bürgerm
eister Einwohner
(Braunschweig, Bürgermeister, Ulrich Markuth) (Braunschweig, Bundesland, Niedersachsen) (Braunschweig, Einwohnerzahl, 248.292)
(Niedersachsen, Landeshauptstadt, Hannover) (Niedersachsen, gegründet, 1946)
(Ulrich Markuth, typ, Politiker)
• Knowledge is represented in subject, predicate, object triples called facts
– Nodes represent entities, classes or literals – Edges represent relationships
Politiker typ
• This seminar is about essential techniques for:
– Building knowledge graphs by extracting information from natural language texts
• Entity Linking
• Relation Extraction
– Managing large knowledge graph data
• Ontology Alignment
• Instance Matching
• Rule Mining
• Knowledge Graph Embeddings
• Type Inference
• Measuring Knowledge Graph Completeness
Seminar Topics
• Entity Linking is
– Recognizing entity mentions in text, disambiguating and linking it to the corresponding entity in a KG
Entity Linking
Braunschweig ist eine Großstadt im Südosten des
Landes Niedersachsen. Mit 248.292 Einwohnern (Stand 31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens.
Braunschweig Niedersachsen Hannover
1946 Ulrich Markuth
248.292
gegründet
Landeshauptstadt
Bundesland Bürgerm
eister
Einwohner
• Given a knowledge graph and a text, we want to extract subject, predicate, object triples
– Words from text have to be mapped to concepts in the knowledge graph
Relation Extraction
Braunschweig ist eine Großstadt im Südosten des Landes Niedersachsen. Mit 248.292 Einwohnern (Stand
31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens. Die kreisfreie Stadt bildet mit den
Städten Salzgitter und Wolfsburg eine Regiopolregion und eines der neun Oberzentren des Bundeslandes. Sie ist Teil der im Jahr 2005 gegründeten Metropolregion Hannover-Braunschweig-
Göttingen-Wolfsburg.
(Braunschweig, ist, Großstadt)
(Braunschweig, Bundesland, Niedersachsen) (Braunschweig Einwohnerzahl 248.292)
(Hannover, Bundesland, Niedersachsen)
• Integrate several knowledge graphs into a single knowledge graph
– Find a matching between classes and relationships of two knowledge graphs
Ontology Alignment
Braunschweig Niedersachsen Bundesland Stadt
typ
Liegt in typ
Braunschweig Niedersachsen Land
Großstadt
typ
bundesland typ
land
Deutschland
Bundesland
• Matching instances from two heterogeneous knowledge graphs
Instance Matching
Braunschweig Niedersachsen Hannover
1946 Ulrich Markuth
248.292
gegründet
Landeshauptstadt
Bundesland Bürgerm
eister
Einwohner Stadt Braunschweig
Niedersachsen Hannover
1.11.1946 Markuth, Ulrich
861
gegründet
Größte Stadt
Bundesland Oberb
ürgerm eister
gegründet
Präsident
Weil, Stephan
• Mine logical rules from large knowledge graphs
– Rules may be used to infer new knowledge
𝐵ü𝑟𝑔𝑒𝑟𝑚𝑒𝑖𝑠𝑡𝑒𝑟(𝑥, 𝑦)⋀Land(y, z) ⇒ 𝑆𝑡𝑎𝑎𝑡𝑠𝑏ü𝑟𝑔𝑒𝑟𝑠𝑐ℎ𝑎𝑓𝑡(𝑥, 𝑧)
Rule Mining in Knowledge Graphs
Braunschweig Deutschland 82,79 Millionen Ulrich Markuth
248.292
Einwohnerzahl
Hauptstadt
Land Bürgerm
eister
Einwo hner
Berlin
Staatsb
ürgerschaft
• Embed entities and relationships from knowledge graphs into vector spaces
– Vectors can be used to measure semantic similarities and to predict new facts
Knowledge Graph Embeddings
Braunschweig
Niedersachsen
TU Braunschweig
Bundesland
Liegt in
Braunschweig
Niedersachsen
TU Braunschweig Bundesland
Liegt in
Rostock Mecklenburg-Vorpommern
Bundesland
Mecklenburg-Vorpommern
Bundesland Rostock
• Automatically learn entity types from a knowledge graph
Type Inference in Knowledge Graphs
Braunschweig Niedersachsen Hannover
1946 Ulrich Markuth
248.292
gegründet
Landeshauptstadt
Bundesland Bürgerm
eister
Einwohner Braunschweig Niedersachsen
Hannover
1946 Ulrich Markuth
248.292
gegründet
Landeshauptstadt
Bundesland Bürge
rmeist er
Einwohner
Stadt typ
Politiker
typ
Stadt
typ
Bundesland
typ
• Predict missing facts in a knowledge graph to assess its completeness
– Having a date of death, but having no death place, implies a missing fact
Measuring Knowledge Graph Completeness
Heinrich der Löwe Welfen Braunschweig
6.8.1195
Adelsgeschlecht
Gestorben am Gest
orben in
Richard Löwenherz
Haus Plantagenet 6.4.1199
Adelsgeschlecht Gestorben am
What is a Good Talk?
A Good Talk
Gestures
Examples Eye Contact
Introduction Interaction
Conclusion Pace
…and more!
Course of Action
24.10.
07.11.
14.11.
21.11.
28.11.
05.12.
12.12.
19.12.
09.01.
16.01.
23.01.
30.01.
06.02.
Introduction and Assignment of topics Analyzing talks 1
8 Talks with Extensive Feedback Analyzing talks I1
Presentation Training I Presentation Training I1
• Building knowledge graphs by extracting information from natural language texts
– Entity Linking
– Relation Extraction
• Managing large knowledge graph data
– Ontology Alignment – Instance Matching – Rule Mining
– Knowledge Graph Embeddings – Type Inference
– Measuring Knowledge Graph Completeness
Choose your topic!
• We offer:
– Guidance and Support – Active Discussion
– Honest and constructive Feedback – Exciting Topics
• We require:
– Intensive preparation of your own talk – Active participation
– Attendance at all seminar dates – No written report