Hello, I'm using in a custom recipe the function PatternMatcher.from_disk
like this:
model = PatternMatcher(spacy.load(spacy_model),
combine_matches=True,
all_examples=True).from_disk(patterns)
In my patterns file I have these two entries:
{"label": "GPE", "pattern": "Murcia"}
{"label": "GPE", "pattern": "Región de Murcia"}
And in my stream I have a text like this one:
{"text": "[...]En el caso de la retirada y destrucción de bovinos muertos en la explotación, el ámbito de aplicación lo constituyen las explotaciones ubicadas en el territorio de las comunidades autónomas de Andalucía, Aragón, Principado de Asturias, Illes Balears, Canarias, Cantabria, Castilla-La Mancha, Castilla y León, Cataluña, Extremadura, Galicia, La Rioja, Madrid, Región de Murcia, Foral de Navarra y Valenciana.[...]"}
The span recognized is "Región de Murcia", not "Murcia", that's because it is longer? If not, which is the criterion to select "Región de Murcia" and not "Murcia"?