añadir filtrado, normalización, modularización

This commit is contained in:
binlaab
2025-11-10 10:58:20 +01:00
parent 3055503bbd
commit ead080b2e5
8 changed files with 351 additions and 86 deletions

0
proyecto/__init__.py Normal file
View File

28
proyecto/filtrado.py Normal file
View File

@@ -0,0 +1,28 @@
from validacion import *
from normalizacion import *
def filtrar_telefono(fichero, tel):
f = open(fichero, "r", encoding="utf-8")
for i in f.readlines():
telefono = i.split(";")[0]
if telefono.strip() == tel:
print(i)
else:
continue
def filtrar_nif(fichero, nif):
f = open(fichero, "r", encoding="utf-8")
for i in f.readlines():
n = i.split(";")[1]
if n.strip() == nif:
print(i)
else:
continue
def filtrar_instante(inicio, fin, fichero):
f = open(fichero, "r", encoding="utf-8")
inicio = normalizar_instante(inicio.strip(), 3)
fin = normalizar_instante(fin.strip(), 3)
for i in f.readlines():
instante = i.split(";")[2]
# terminar

70
proyecto/main.py Normal file
View File

@@ -0,0 +1,70 @@
import regex as re
import sys
from filtrado import *
from validacion import *
from normalizacion import *
from variables import *
# -n: normaliza el fichero en pos[-n] + 1 con los formatos:
# +34[numero]
# formato 2 para instantes temporales
# formato 3 para coordenadas
# nif, producto y precio originales
# se puede pasar f1 para el formato de las fechas y f2 para las coordenadas [param. opc.]
# -sphone, -snif: filtran por teléfono y nif
# -stime: filtran de una fecha hasta otra
# -slocation: puntos extra
# la salida aparece como campo1 ; campo2 ; campo3 ; ...
# los errores de formato o sintaxis en los argumentos son exit N
# los errores en el archivo se ignoran
def main():
l = open("../log.txt", encoding="utf-8")
for linea in l.readlines():
pass
# print(validarEntrada(linea.strip()))
# n, sphone, stime, snif
arg_prueba = "-sphone 123456789 telefonos -stime 11:11:11 11:11:12 tiempos -n normalizar 1 2 -snif 12345678B fichero"
argumentos = r"(?P<sphone>-sphone (?P<telefono>\S*) (?P<fichero>\S*))|(?P<stime>-stime (?P<inicio>\S*) (?P<final>\S*) (?P<fichero1>\S*))|(?P<n>-n (?P<fichero2>\S*))|(?P<snif>-snif (?P<nif>\S*) (?P<fichero3>\S*))"
A = re.compile(argumentos)
match = A.finditer(arg_prueba)
argv = sys.argv
try:
if '-n' in argv:
fichero = argv[argv.index('-n') + 1]
try: # un poco chapucero
formato_fecha = int(argv[argv.index('-n') + 2])
formato_coordenadas = int(argv[argv.index('-n') + 3])
except IndexError:
formato_fecha = 2
formato_coordenadas = 3
normalizar(fichero, formato_fecha, formato_coordenadas)
elif '-sphone' in argv:
telefono = int(argv[argv.index('-sphone') + 1])
fichero = argv[argv.index('-sphone') + 2]
filtrar_telefono(telefono, fichero)
elif '-snif' in argv:
nif = argv[argv.index('-snif') + 1]
fichero = argv[argv.index('-snif') + 2]
filtrar_nif(nif, fichero)
elif '-stime' in argv: # convertir entre formatos
desde = argv[argv.index('-stime') + 1]
hasta = argv[argv.index('-stime') + 2]
fichero = argv[argv.index('-stime') + 3]
print("stime")
except FileNotFoundError as e:
print(e)
exit(1)
if __name__ == "__main__":
main()

59
proyecto/normalizacion.py Normal file
View File

@@ -0,0 +1,59 @@
from validacion import *
from variables import *
def normalizar_instante(instante, formato):
d = validarInstante(instante)
if d is None:
return None
if formato == 1:
if not d['mes'].isdigit():
d['mes'] = meses.index(d['mes'].lower()) + 1
return f"{d['año']}-{d['mes']:0>2}-{d['dia']:0>2} {d['hora']:0>2}:{d['minuto']}"
elif formato == 2:
if d['mes'] in meses:
return f"{d['mes']} {d['dia']}, {d['año']} {d['hora']}:{d['minuto']} {d['segundo']}"
else:
if int(d['hora']) > 12:
d['hora'] = int(d['hora']) % 12
if d['mes'].isdigit():
d['mes'] = meses[int(d['mes']) - 1]
return f"{d['mes'].lower()} {d['dia']}, {d['año']} {d['hora']}:{d['minuto']} AM"
elif formato == 3:
if not d['mes'].isdigit():
d['mes'] = meses.index(d['mes'].lower()) + 1
if not d['segundo'].isdigit():
d['segundo'] = '00'
return f"{d['hora']}:{d['minuto']}:{d['segundo']} {d['dia']}/{d['mes']}/{d['año']}"
def normalizar_telefono(telefono):
telefono = re.sub(r'( )|(-)', r'', telefono)
if telefono[0] != '+':
return f'+34{telefono}'
return telefono
def normalizar_coordenada(coordenada, formato):
c = validarCoordenada(coordenada, formato)
return c
def normalizar(fichero, formato_fecha, formato_coordenadas):
try:
f = open(fichero, 'r')
except:
exit(1)
n = 0
for i in f.readlines():
telefono, nif, instante, coordenada, producto, precio = i.split(";")
instante = normalizar_instante(instante.strip(), 1)
telefono = normalizar_telefono(telefono.strip())
coordenada = normalizar_coordenada(coordenada.strip(), 3)
print(instante, telefono, coordenada)
n += 1
print(n)

169
proyecto/validacion.py Normal file
View File

@@ -0,0 +1,169 @@
import regex as re
from variables import *
def comprobarLetra(dni: str):
num = int(dni[:-1])
letra = dni[-1]
if letras[num % 23] != letra:
return False
else:
return True
def validarTelefono(telefono): # revisar sesión 6 ej 1
match = T.match(telefono)
if match is not None:
# if match.group('prefijo') is None:
# prefijo = '+34'
# else:
# prefijo = match.group('prefijo')
return {
# 'prefijo': prefijo,
'parte1': match.group('parte1'),
'parte2': match.group('parte2'),
'parte3': match.group('parte3'),
}
return None
def validarDni(dni):
match = D.match(dni)
if match and match['letrainicio']:
valido = comprobarLetra(f"{reemplazo_nie[match['letrainicio']]}{match['numero']}{match['letrafinal']}")
if valido:
return {
'letrainicio': match.group('letrainicio'),
'numero': match.group('numero'),
'letrafinal': match.group('letrafinal'),
}
return None
elif match and not match['letrainicio']:
valido = comprobarLetra(f"{match['numero']}{match['letrafinal']}")
if valido:
return {
'numero': match['numero'],
'letrafinal': match.group('letrafinal'),
}
return None
else:
return None
def validarInstante(instante):
match = I.match(instante)
if match and not match['segundo']: # formato 1
return {
'año': match.group('anyo'),
'mes': match.group('mes'),
'dia': match.group('dia'),
'hora': match.group('hora'),
'minuto': match.group('minuto'),
'segundo': '00'
}
elif match and match['segundo']: # formatos 2 y 3
return {
'año': match.group('anyo'),
'mes': match.group('mes'),
'dia': match.group('dia'),
'hora': match.group('hora'),
'minuto': match.group('minuto'),
'segundo': match.group('segundo'),
}
else:
return None
def decimalGrado(numero):
a = float(numero)
grados = int(numero)
b = a - grados
minutos = int(b*60)
c = b*60-minutos
segundos = int(c*60)
return grados,minutos,segundos
def gradoDecimal(grados,minutos,segundos):
a = float(segundos)/3600 + float(minutos)/60 + float(grados)
return a
def validarCoordenada(cadena, form):
if P.fullmatch():
M = P.fullmatch()
if M.group("Grados1"):
grados1 = M.group("Grados1")
grados2 = M.group("Grados2")
minutos1 = M.group("Minutos1")
minutos2 = M.group("Minutos2")
segundos1 = M.group("Segundos1")
segundos2 = M.group("Segundos2")
letra1 = M.group("Letra1")
letra2 = M.group("Letra2")
num1 = gradoDecimal(grados1,minutos1,segundos1)
num2 = gradoDecimal(grados2,minutos2,segundos2)
if letra1 == 'N':
simb1 = '+'
else:
simb1 = '-'
if letra2== 'E':
simb2 = '+'
else:
simb2 = '-'
else:
num1 = float(M.group("Coord1"))
num2 = float(M.group("Coord2"))
simb1 = M.group("Signo1")
simb2 = M.group("Signo2")
if form == 1:
return f'{simb1}{round(num1,4)}, {simb2}{round(num2,4)}'
elif form == 2:
grados1, minutos1, segundos1= decimalGrado(num1)
grados2, minutos2, segundos2 = decimalGrado(num2)
if simb1 == '+':
letra1 = 'N'
else:
letra1 = 'S'
if simb2 == '+':
letra2 = 'E'
else:
letra2 = 'W'
return f'{grados1}º {minutos1}\' {segundos1:}.0000" {letra1}, {grados2}º {minutos2}\' {segundos2}.0000" {letra2}'
elif form == 3:
grados1, minutos1, segundos1 = decimalGrado(num1)
grados2, minutos2, segundos2 = decimalGrado(num2)
if simb1 == '+':
letra1 = 'N'
else:
letra1 = 'S'
if simb2 == '+':
letra2 = 'E'
else:
letra2 = 'W'
return f'{grados1:0>3}{minutos1:0>2}{segundos1:0>2}.0000{letra1}{grados2:0>3}{minutos2:0>2}{segundos2:0>2}.0000{letra2}'
else:
return None
def validarEntrada(entrada):
telefono, dni, fecha, coordenadas, producto, coste = entrada.split(";")
tel = validarTelefono(telefono.strip())
dni = validarDni(dni.strip())
fecha = validarInstante(fecha.strip())
coordenadas = validarCoordenada(coordenadas.strip())
valores = {
'telefono': tel,
'dni': dni,
'fecha': fecha,
'coordenadas': coordenadas,
'producto': producto,
'coste': coste,
}
for k in valores.keys():
if valores[k] is None:
return None
return valores

21
proyecto/variables.py Normal file
View File

@@ -0,0 +1,21 @@
import regex as re
letras = ['T', 'R', 'W', 'A', 'G', 'M', 'Y', 'F', 'P', 'D', 'X', 'B', 'N', 'J', 'Z', 'S', 'Q', 'V', 'H', 'L', 'C', 'K', 'E']
reemplazo_nie = {
'X': 0,
'Y': 1,
'Z': 2,
None: '',
}
meses = ['january', 'february', 'march', 'april', 'may', 'june', 'july', 'august', 'september', 'october', 'november', 'december']
t = r"(?P<prefijo>\+[0-9]+)? *(?P<parte1>\d{3})-(?P<parte2>\d{3})-(?P<parte3>\d{3})"
T = re.compile(t)
d = r"(((?P<letrainicio>[X-Z])*(?P<numero>\d{7}))|(?P<numero>\d{8}))-(?P<letrafinal>[A-HJ-NP-TV-Z])" # cambiar, el nie son 7
D = re.compile(d, flags=re.I|re.M)
i = r"((?P<anyo>0{3}[1-9]|\d{4})-(?P<mes>0\d|1[0-2])-(?P<dia>[0-2]\d|3[01])\s+(?P<hora>[0-1]\d|2[0-4]):(?P<minuto>[0-5]\d))|((?P<mes>january|february|march|april|may|june|july|august|september|october|november|december)\s+(?P<dia>\d|[12]\d|3[01]),\s+(?P<anyo>0{3}[1-9]|\d{4})\s+(?P<hora>[1-9]|1[0-2]):(?P<minuto>[0-5]\d)\s+(?P<segundo>[ap]m))|((?P<hora>[01]\d|2[0-3]):(?P<minuto>[0-5]\d):(?P<segundo>[0-5]\d)\s+(?P<dia>[0-2]\d|3[01])/(?P<mes>0\d|1[0-2])/(?P<anyo>0{3}[1-9]|\d{4}))"
I = re.compile(i, flags=re.IGNORECASE)
R = r"( *(?P<Grados1>([0-2][0-9][0-9])|(3[0-5][0-9]))(?P<Minutos1>[0-6][0-9])(?P<Segundos1>[0-6][0-9]\.\d{4})(?P<Letra1>(N|S))(?P<Grados2>([0-2][0-9][0-9])|(3[0-5][0-9]))(?P<Minutos2>[0-6][0-9])(?P<Segundos2>[0-6][0-9]\.\d{4})(?P<Letra2>(W|E)) *)|( *(?P<Grados1>((1[0-9][0-9])|(2[0-9][0-9])|(3[0-5][0-9])|\d{2}|\d{1}))° *(?P<Minutos1>([0-5][0-9])|[0-9])' *(?P<Segundos1>(([0-5][0-9])|[0-9])\.\d{4})\" *(?P<Letra1>(N|S)) *, *(?P<Grados2>((1[0-9][0-9])|(2[0-9][0-9])|(3[0-5][0-9])|\d{2}|\d{1}))° *(?P<Minutos2>([0-5][0-9])|[0-9])' *(?P<Segundos2>(([0-5][0-9])|[0-9])\.\d{4})\" *(?P<Letra2>(W|E)) *)|( *((?P<Signo1>[+|\-| ])(?P<Coord1>(([1-8]?[0-9])\.\d+)|90)) *, *((?P<Signo2>[+|\-| ])(?P<Coord2>([1][1-7][1-9]\.\d+)|([1-8]?[0-9]\.\d+))|90) *)"
P = re.compile(R)