I have the following problem: I have strings that contain numbers that may include dots or commas. E.g.:
text = 'ην Θεσσαλονίκη και κατοικεί στην Καλαμαριά Θεσσαλονίκης, (οδός Επανομής 32)Το κεφάλαιο της εταιρείας ορίζεται στο ποσό των δέκα χιλιάδων διακόσια (10.200) ευρώ, διαιρούμενο σε δέκα χιλιάδες διακόσια (10.200) εταιρικά μερίδια, ονομαστικής αξίας ενός (1) ευρώ το καθένα, το οποίο καλύφθηκε ολοσχερώς'
Then I have the number without any symbols, e.g. '10200'.
I would like to find the location of the substring '10.200' within the string.
I guess one way would be to create a method that would insert dots in the number.
But another way would be to perform some form of fuzzy matching.
To that end, I experimented with the regex module but not successfully. I.e.:
import regex
regex.search('(10200){i}', f'{text}' )
Returns:
<regex.Match object; span=(1, 154), match='ν Θεσσαλονίκη και κατοικεί στην Καλαμαριά Θεσσαλονίκης, (οδός Επανομής 32)Το κεφάλαιο της εταιρείας ορίζεται στο ποσό \nτων δέκα χιλιάδων διακόσια (10.200', fuzzy_counts=(0, 148, 0)>
So, it does not match 10.200 as I had hoped.
What would you suggest?