Grounded Language Learning Models for Ambiguous Supervision

Joohyun KimSupervising Professor Raymond J Mooney

PhD Thesis Defense TalkAugust 23 2013

Outlinebull IntroductionMotivationbull Grounded Language Learning in Limited Ambiguity (Kim and

Mooney COLING 2010)ndash Learning to sportscast

bull Grounded Language Learning in High Ambiguity (Kim and Mooney EMNLP 2012)ndash Learn to follow navigational instructions

bull Discriminative Reranking for Grounded Language Learning (Kim and Mooney ACL 2013)

bull Future Directionsbull Conclusion

Language Grounding

bull The process to acquire the semantics of natural language with respect to relevant perceptual contexts

bull Human child grounds language to perceptual contexts via repetitive exposure in statistical way (Saffran et al 1999 Saffran 2003)

bull Ideally we want computational system to learn from the similar way

Language Grounding Machine

Iranrsquos goalkeeper blocks the ball

Block(IranGoalKeeper)

Machine 6

Computer VisionLanguage Learning

Natural Language and Meaning Representation

Iranrsquos goalkeeper blocks the ball Block(IranGoalKeeper)

Natural Language (NL)

NL A language that arises naturally by the innate nature of human intellect such as English German French Korean etc

MRL Formal languages that machine can understand such as logic or any computer-executable code

Meaning Representation Language (MRL)Natural Language (NL)

Semantic Parsing and Surface Realization

Semantic Parsing maps a natural-language sentence to a full detailed semantic representationrarr Machine understands natural language

Semantic Parsing (NL MRL)

Surface Realization Generates a natural-language sentence from a meaning representationrarr Machine communicates with natural language

Surface Realization (NL MRL)

Conventional Language Learning Systemsbull Requires manually annotated corporabull Time-consuming hard to acquire and not scalable

Manually Annotated Training Corpora(NLMRL pairs)

Semantic Parser

Semantic Parser Learner

Learning from Perceptual Environment

bull Motivated by how children learn language in rich ambiguous perceptual environment with linguistic input

bull Advantagesndash Naturally obtainable corporandash Relatively easy to annotatendash Motivated by natural process of human language

learning

Navigation Example

식당에서 우회전 하세요Alice

Bob15Slide from David Chen

Navigation Example

병원에서 우회전 하세요

16Slide from David Chen

Navigation Example

Scenario 1

Scenario 2병원에서 우회전 하세요

식당에서 우회전 하세요

Navigation Example

Scenario 1

Scenario 2식당에서 우회전 하세요

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

Thesis Contributionsbull Generative models for grounded language learning from

ambiguous perceptual environmentndash Unified probabilistic model incorporating linguistic cues and MR

structures (vs previous approaches)ndash General framework of probabilistic approaches that learn NL-MR

correspondences from ambiguous supervisionbull Adapting discriminative reranking to grounded language

learningndash Standard reranking is not availablendash No single gold-standard reference for training datandash Weak response from perceptual environment can train

discriminative reranker

bull Learn to interpret and follow navigation instructions ndash eg Go down this hall and make a right when you see

an elevator to your left bull Use virtual worlds and instructorfollower data

from MacMahon et al (2006)bull No prior linguistic knowledgebull Infer language semantics by observing how

humans follow instructions

Navigation Task (Chen and Mooney 2011)

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Sample Environment (MacMahon et al 2006)

Executing Test Instruction

Task Objectivebull Learn the underlying meanings of instructions by observing

human actions for the instructions ndash Learn to map instructions (NL) into correct formal plan of actions

(MR)bull Learn from high ambiguityndash Training input of NL instruction landmarks plan (Chen and Mooney

2011) pairsndash Landmarks plan

Describe actions in the environment along with notable objects encountered on the way

Overestimate the meaning of the instruction including unnecessary details

Only subset of the plan is relevant for the instruction29

Challenges

Instruc-tion

at the easel go left and then take a right onto the blue path at the corner

Landmarks plan

Travel ( steps 1 ) Verify ( at EASEL side CONCRETE HALLWAY ) Turn ( LEFT ) Verify ( front CONCRETE HALLWAY ) Travel ( steps 1 ) Verify ( side BLUE HALLWAY front WALL ) Turn ( RIGHT ) Verify ( back WALL front BLUE HALLWAY front CHAIR front HATRACK left WALL right EASEL )

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Exponential Number of Possibilities Combinatorial matching problem between instruction and landmarks plan

Previous Work (Chen and Mooney 2011)

bull Circumvent combinatorial NL-MR correspondence problemndash Constructs supervised NL-MR training data by refining

landmarks plan with learned semantic lexiconGreedily select high-score lexemes to choose probable MR

components out of landmarks planndash Trains supervised semantic parser to map novel instruction

(NL) to correct formal plan (MR)ndash Loses information during refinement

Deterministically select high-score lexemesIgnores possibly useful low-score lexemesSome relevant MR components are not considered at all

Proposed Solution (Kim and Mooney 2012)

bull Learn probabilistic semantic parser directly from ambiguous training datandash Disambiguate input + learn to map NL instructions to

formal MR planndash Semantic lexicon (Chen and Mooney 2011) as basic unit for

building NL-MR correspondencesndash Transforms into standard PCFG (Probabilistic

Context-Free Grammar) induction problem with semantic lexemes as nonterminals and NL words as terminals

Learning system for parsing navigation instructions

Observation

Instruction

World State

Execution Module (MARCO)

Instruction

World State

TrainingTesting

Action TraceNavigation Plan Constructor

(Supervised) Semantic Parser Learner

Plan Refinement

Semantic Parser

Action Trace

System Diagram (Chen and Mooney 2011)

Landmarks Plan

Supervised Refined Plan

LearningInference

Possibleinformationloss

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Probabilistic Semantic Parser Learner (from

ambiguous supervison)

Semantic Parser

Action Trace

System Diagram of Proposed Solution

Landmarks Plan

PCFG Induction Model for Grounded Language Learning (Borschinger et al 2011)

bull PCFG rules to describe generative process from MR components to corresponding NL words

Hierarchy Generation PCFG Model (Kim and Mooney 2012)

bull Limitations of Borschinger et al 2011ndash Only work in low ambiguity settings

1 NL ndash a handful of MRs ( order of 10s)ndash Only output MRs included in the constructed PCFG from training

databull Proposed model

ndash Use semantic lexemes as units of semantic conceptsndash Disambiguate NL-MR correspondences in semantic concept

(lexeme) levelndash Disambiguate much higher level of ambiguous supervisionndash Output novel MRs not appearing in the PCFG by composing MR

parse with semantic lexeme MRs38

bull Pair of NL phrase w and MR subgraph gbull Based on correlations between NL instructions and

context MRs (landmarks plans)ndash How graph g is probable given seeing phrase w

bull Examplesndash ldquoto the stoolrdquo Travel() Verify(at BARSTOOL)ndash ldquoblack easelrdquo Verify(at EASEL)ndash ldquoturn left and walkrdquo Turn() Travel()

Semantic Lexicon (Chen and Mooney 2011)

cooccurrenceof g and w

general occurrenceof g without w

Lexeme Hierarchy Graph (LHG)bull Hierarchy of semantic lexemes

by subgraph relationship constructed for each training examplendash Lexeme MRs = semantic

conceptsndash Lexeme hierarchy = semantic

concept hierarchyndash Shows how complicated

semantic concepts hierarchically generate smaller concepts and further connected to NL word groundings

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Verify Travel Verify

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

bull Add rules per each node in LHGndash Each complex concept chooses which subconcepts to

describe that will finally be connected to NL instructionEach node generates all k-permutations of children nodes

ndash we do not know which subset is correctndash NL words are generated by lexeme nodes by unigram

Markov process (Borschinger et al 2011)

ndash PCFG rule weights are optimized by EMMost probable MR components out of all possible

combinations are estimated41

PCFG Construction

Child concepts are generated from parent concepts selec-tively

All semantic concepts gen-erate relevant NL words

Each semantic concept generates at least one NL word

Parsing New NL Sentences

bull PCFG rule weights are optimized by Inside-Outside algorithm with training data

bull Obtain the most probable parse tree for each test NL sentence from the learned weights using CKY algorithm

bull Compose final MR parse from lexeme MRs appeared in the parse treendash Consider only the lexeme MRs responsible for generating

NL wordsndash From the bottom of the tree mark only responsible MR

components that propagate to the top levelndash Able to compose novel MRs never seen in the training data

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

Turn left and find the sofa then turn around

the corner

Most probable parse tree for a test NL instruction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Verify Travel Verify Turn

LEFT atSOFA

Travel Verify Turn

Unigram Generation PCFG Model

bull Limitations of Hierarchy Generation PCFG Model ndash Complexities caused by Lexeme Hierarchy Graph

and k-permutationsndash Tend to over-fit to the training data

bull Proposed Solution Simpler modelndash Generate relevant semantic lexemes one by onendash No extra PCFG rules for k-permutationsndash Maintains simpler PCFG rule set faster to train

PCFG Construction

bull Unigram Markov generation of relevant lexemesndash Each context MR generates relevant lexemes one

by onendash Permutations of the appearing orders of relevant

lexemes are already considered

PCFG Construction

Each semantic concept is generated by unigram Markov process

bull Follows the similar scheme as in Hierarchy Generation PCFG model

bull Compose final MR parse from lexeme MRs appeared in the parse treendash Consider only the lexeme MRs responsible for

generating NL wordsndash Mark relevant lexeme MR components in the

context MR appearing in the top nonterminal

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

Turn left and find the sofa then turn around the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Databull 3 maps 6 instructors 1-15 followersdirectionbull Hand-segmented into single sentence steps to make the learning easier

(Chen amp Mooney 2011)bull Mandarin Chinese translation of each sentence (Chen 2012)

bull Word-segmented version by Stanford Chinese Word Segmenterbull Character-segmented version

Take the wood path towards the easel At the easel go left and then take a right on the the blue path at the corner Follow the blue path towards the chair and at the chair take a right towards the stool When you reach the stool you are at 7

Paragraph Single sentenceTake the wood path towards the easel

At the easel go left and then take a right on the the blue path at the corner

Turn Forward Turn left Forward Turn right Forward x 3 Turn right Forward

Forward Turn left Forward Turn right

Data Statistics

Paragraph Single-Sentence

Instructions 706 3236

Avg sentences 50 (plusmn28) 10 (plusmn0)

Avg actions 104 (plusmn57) 21 (plusmn24)

Avg words sent

English 376 (plusmn211) 78 (plusmn51)

Chinese-Word 316 (plusmn181) 69 (plusmn49)

Chinese-Character 489 (plusmn283) 106 (plusmn73)

Vo-cabu-lary

English 660 629

Chinese-Word 661 508

Chinese-Character 448 328

Evaluationsbull Leave-one-map-out approach

ndash 2 maps for training and 1 map for testingndash Parse accuracy amp Plan execution accuracy

bull Compared with Chen and Mooney 2011 and Chen 2012ndash Ambiguous context (landmarks plan) is refined by greedy

selection of high-score lexemes with two different lexicon learning algorithmsChen and Mooney 2011 Graph Intersection Lexicon Learning (GILL)Chen 2012 Subgraph Generation Online Lexicon Learning (SGOLL)

ndash Semantic parser KRISP (Kate and Mooney 2006) trained on the resulting supervised data

Parse Accuracy

bull Evaluate how well the learned semantic parsers can parse novel sentences in test data

bull Metric partial parse accuracy

Parse Accuracy (English)

Precision Recall F1

Chen amp Mooney (2011) Chen (2012)Hierarchy Generation PCFG Model Unigram Generation PCFG Model

Parse Accuracy (Chinese-Word)

Precision Recall F1

73667641

Chen (2012) Hierarchy Generation PCFG ModelUnigram Generation PCFG Model

Parse Accuracy (Chinese-Character)

Precision Recall F1

75527755

End-to-End Execution Evaluations

bull Test how well the formal plan from the output of semantic parser reaches the destination

bull Strict metric Only successful if the final position matches exactlyndash Also consider facing direction in single-sentencendash Paragraph execution is affected by even one

single-sentence execution

End-to-End Execution Evaluations(English)

Single-Sentence Paragraph

End-to-End Execution Evaluations(Chinese-Word)

End-to-End Execution Evaluations(Chinese-Character)

Discussionbull Better recall in parse accuracy

ndash Our probabilistic model uses useful but low score lexemes as well rarr more coverage

ndash Unified models are not vulnerable to intermediate information loss bull Hierarchy Generation PCFG model over-fits to training data

ndash Complexities LHG and k-permutation rulesParticularly weak in Chinese-character corpus Longer avg sentence length hard to estimate PCFG weights

bull Unigram Generation PCFG model is betterndash Less complexity avoid over-fitting better generalization

bull Better than Borschinger et al 2011ndash Overcome intractability in complex MRLndash Learn from more general complex ambiguityndash Novel MR parses never seen during training 66

Comparison of Grammar Size and EM Training Time

Hierarchy GenerationPCFG Model

Unigram GenerationPCFG Model

|Grammar| Time (hrs) |Grammar| Time (hrs)

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

Chinese (Character) 19792 1864 13514 1258

Discriminative Rerankingbull Effective approach to improve performance of generative

models with secondary discriminative modelbull Applied to various NLP tasks

ndash Syntactic parsing (Collins ICML 2000 Collins ACL 2002 Charniak amp Johnson ACL 2005)

ndash Semantic parsing (Lu et al EMNLP 2008 Ge and Mooney ACL 2006)

ndash Part-of-speech tagging (Collins EMNLP 2002)

ndash Semantic role labeling (Toutanova et al ACL 2005)

ndash Named entity recognition (Collins ACL 2002)

ndash Machine translation (Shen et al NAACL 2004 Fraser and Marcu ACL 2006)

ndash Surface realization in language generation (White amp Rajkumar EMNLP 2009 Konstas amp Lapata ACL 2012)

bull Goal ndash Adapt discriminative reranking to grounded language learning

Discriminative Reranking

bull Generative modelndash Trained model outputs the best result with max probability

TrainedGenerative

1-best candidate with maximum probability

Candidate 1

Testing Example

Discriminative Rerankingbull Can we do better

ndash Secondary discriminative model picks the best out of n-best candidates from baseline model

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

How can we apply discriminative reranking

bull Impossible to apply standard discriminative reranking to grounded language learningndash Lack of a single gold-standard reference for each training examplendash Instead provides weak supervision of surrounding perceptual

context (landmarks plan)bull Use response feedback from perceptual world ndash Evaluate candidate formal MRs by executing them in simulated

worldsUsed in evaluating the final end-task plan execution

ndash Weak indication of whether a candidate is goodbadndash Multiple candidate parses for parameter update

Response signal is weak and distributed over all candidates

Reranking Model Averaged Perceptron (Collins 2000)

bull Parameter weight vector is updated when trained model predicts a wrong candidate

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Gold StandardReference

Best prediction

Updatefeaturevector119938120783

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

Our generative models

NotAvailable

Response-based Weight Update

bull Pick a pseudo-gold parse out of all candidatesndash Most preferred one in terms of plan executionndash Evaluate composed MR plans from candidate parses ndash MARCO (MacMahon et al AAAI 2006) execution module runs and

evaluates each candidate MR in the worldAlso used for evaluating end-goal plan execution performance

ndash Record Execution Success RateWhether each candidate MR reaches the intended destinationMARCO is nondeterministic average over 10 trials

ndash Prefer the candidate with the best execution success rate during training

Response-based Updatebull Select pseudo-gold reference based on MARCO execution

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Pseudo-goldReference

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

Feature vector difference

MARCOExecutionModule

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Weight Update with Multiple Parses

bull Candidates other than pseudo-gold could be useful ndash Multiple parses may have same maximum execution success ratesndash ldquoLowerrdquo execution success rates could mean correct plan given

indirect supervision of human follower actionsMR plans are underspecified or ignorable details attachedSometimes inaccurate but contain correct MR components to reach the

desired goal

bull Weight update with multiple candidate parsesndash Use candidates with higher execution success rates than currently

best-predicted candidatendash Update with feature vector difference weighted by difference

between execution success rates

bull Weight update with multiple candidates that have higher execution success rate than currently predicted parse

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

Feature vector Difference

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

bull Binary indicator whether a certain composition of nonterminalsterminals appear in parse tree(Collins EMNLP 2002 Lu et al EMNLP 2008 Ge amp Mooney ACL 2006)

L1 Turn(LEFT) Verify(frontSOFA backEASEL) Travel(steps2) Verify(atSOFA) Turn(RIGHT)

Features

L2 Turn(LEFT) Verify(frontSOFA) L3 Travel(steps2) Verify(atSOFA) Turn(RIGHT)

L4 Turn(LEFT) L5 Travel() Verify(atSOFA) L6 Turn()

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

Evaluationsbull Leave-one-map-out approachndash 2 maps for training and 1 map for testingndash Parse accuracy ndash Plan execution accuracy (end goal)

bull Compared with two baseline modelsndash Hierarchy and Unigram Generation PCFG modelsndash All reranking results use 50-best parsesndash Try to get 50-best distinct composed MR plans and according

parses out of 1000000-best parsesMany parse trees differ insignificantly leading to same derived MR

plansGenerate sufficiently large 1000000-best parse trees from baseline

model80

Response-based Update vs Baseline(English)

Hierarchy Unigram

Parse F1

BaselineResponse-based

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Response-based Update vs Baseline (Chinese-Word)

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Response-based Update vs Baseline(Chinese-Character)

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Response-based Update vs Baseline

bull vs Baselinendash Response-based approach performs better in the final end-

task plan executionndash Optimize the model for plan execution

Response-based Update with Multiple vs Single Parses (English)

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Response-based Update with Multiple vs Single Parses (Chinese-Word)

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Response-based Update with Multiple vs Single Parses (Chinese-Character)

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Response-based Update with Multiple vs Single Parses

bull Using multiple parses improves the performance in generalndash Single-best pseudo-gold parse provides only weak

feedbackndash Candidates with low execution success rates

produce underspecified plans or plans with ignorable details but capturing gist of preferred actions

ndash A variety of preferable parses help improve the amount and the quality of weak feedback

Future Directions

bull Integrating syntactic componentsndash Learn joint model of syntactic and semantic structure

bull Large-scale datandash Data collection model adaptation to large-scale

bull Machine translationndash Application to summarized translation

bull Real perceptual datandash Learn with raw features (sensory and vision data)

Conclusion

bull Conventional language learning is expensive and not scalable due to annotation of training data

bull Grounded language learning from relevant perceptual context is promising and training corpus is easy to obtain

bull Our proposed models provide general framework of full probabilistic model for learning NL-MR correspondences with ambiguous supervision

bull Discriminative reranking is possible and effective with weak feedback from perceptual environment

Thank You

Outline

Outline (2)

Language Grounding

Language Grounding Machine (2)

Natural Language and Meaning Representation (2)

Semantic Parsing and Surface Realization (2)

Conventional Language Learning Systems

Navigation Example

Navigation Example (2)

Thesis Contributions

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Induction Model for Grounded Language Learning (Borschinge

Lexeme Hierarchy Graph (LHG)

PCFG Construction

PCFG Construction (2)

Parsing New NL Sentences (2)

Data Statistics

Evaluations

Parse Accuracy

End-to-End Execution Evaluations (English)

End-to-End Execution Evaluations (Chinese-Word)

End-to-End Execution Evaluations (Chinese-Character)

Discussion

Outline (4)

Discriminative Reranking (2)

Response-based Update

Weight Update with Multiple Parses (2)

Features

Evaluations (2)

Response-based Update vs Baseline (English)

Response-based Update vs Baseline (Chinese-Character)

Response-based Update with Multiple vs Single Parses (English

Response-based Update with Multiple vs Single Parses (Chinese

Response-based Update with Multiple vs Single Parses (Chinese (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Language Grounding

Machine 6

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Language Grounding

Machine 6

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Language Grounding

Machine 6

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Machine 6

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Machine 6

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Semantic Parser

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

learning

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Make a right turn

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Scenario 2

식당

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Navigation Example

Scenario 1

Scenario 2병원

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

H ndash Hat Rack

L ndash Lamp

E ndash Easel

S ndash Sofa

B ndash Barstool

C - Chair

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Challenges

Instruc-tion

Landmarks plan

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Challenges

Instruc-tion

Correctplan

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Plan Refinement

Semantic Parser

Action Trace

Landmarks Plan

LearningInference

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Observation

Instruction

World State

Instruction

World State

TrainingTesting

Semantic Parser

Action Trace

Landmarks Plan

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

RIGHT sideHATRACK

frontSOFA

steps3

atEASEL

Travel Verify

atEASEL

Verify

RIGHT sideHATRACK

Verify Travel

sideHATRACK

Verify

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

the corner

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT frontSOFA

Verify

steps2

atSOFA

Travel Verify Turn

atSOFA

Travel Verify Turn

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

PCFG Construction

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

Context MR

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify

ContextMR

RelevantLexemes

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

LEFTfrontBLUEHALL

frontSOFA

steps2

atSOFA

LEFT atSOFA

Travel Verify Turn

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Data Statistics

Avg words sent

Vo-cabu-lary

English 660 629

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Parse Accuracy

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Precision Recall F1

73667641

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Precision Recall F1

75527755

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

English 20451 1726 16357 878

Chinese (Word) 21636 1599 15459 805

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedGenerative

Candidate 1

Testing Example

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Testing Example

TrainedSecondary

DiscriminativeModel

Best prediction

Output

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

TrainedBaseline

GenerativeModel

hellip

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate nhellip

Training Example

Perceptron

Best prediction

119938120784

119938120785

119938120786

119938119951119938119944

119938119944minus119938120786

perceptronscore

NotAvailable

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

results

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

UpdateDerived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

desired goal

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (1)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

n-best candidates

Candidate 1

Candidate 2

Candidate 3

Candidate 4

Candidate n

hellip

Perceptron

Best prediction

Update (2)Derived

119924119929120783

119924119929120784

119924119929120785

119924119929120786

119924119929119951

ExecutionSuccess

Rate120782 120788120782 120786120782 120782

120782 120791

120782 120784

PerceptronScore

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Features

119943 (119923120783rarr119923120785 )=120783119943 (119923120785rarr119923120787or119923120783)=120783119943 (119923120785rArr119923120787119923120788 )=120783119943 (119923120787119839119842119847119837 )=120783

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

model80

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Hierarchy Unigram

Single-sentence

Baseline Single

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Hierarchy Unigram

6346412

Single-sentence

Hierarchy Unigram

Paragraph

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Hierarchy Unigram

62856408

Single-sentence

Hierarchy Unigram

23332225

Paragraph

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Hierarchy Unigram

79767944

Parse F1

Single Multi

Hierarchy Unigram

Single-sentence

Single Multi

Hierarchy Unigram

Paragraph

Single Multi

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Future Directions

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Outline

Outline (2)

Language Grounding

Navigation Example

Outline (3)

Task Objective

Challenges

Challenges (2)

Challenges (3)

PCFG Construction

Data Statistics

Evaluations

Parse Accuracy

Discussion

Outline (4)

Features

Evaluations (2)

Outline (5)

Future Directions

Outline (6)

Conclusion

Thank You

Documents

Grounded Language Learning Models for Ambiguous Supervision