Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
Ya estoy inscrito ¿Todavía no tienes acceso? Nuestros Planes
1
respuesta

Duda--referente al modelado de datos

me podria orientar como solucionar este error que no me permite cargar los pandas, dice que el servidor de github ha recibido muchas solicitudes y esta bloqueado.... NO PUEDO AVANZAR CON MI MODELADO DE DATOS

import pandas as pd

url = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_1%20.csv" url2 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_2.csv" url3 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_3.csv" url4 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_4.csv"

tienda = pd.read_csv(url) tienda2 = pd.read_csv(url2) tienda3 = pd.read_csv(url3) tienda4 = pd.read_csv(url4)

tienda.head()


HTTPError Traceback (most recent call last) Cell In[2], line 10 8 tienda = pd.read_csv(url) 9 tienda2 = pd.read_csv(url2) ---> 10 tienda3 = pd.read_csv(url3) 11 tienda4 = pd.read_csv(url4) 13 tienda.head()

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\site-packages\pandas\io\parsers\readers.py:620, in _read(filepath_or_buffer, kwds) 617 _validate_names(kwds.get("names", None)) 619 # Create the parser. --> 620 parser = TextFileReader(filepath_or_buffer, **kwds) 622 if chunksize or iterator: 623 return parser

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\site-packages\pandas\io\parsers\readers.py:1620, in TextFileReader.init(self, f, engine, **kwds) 1617 self.options["has_index_names"] = kwds["has_index_names"] 1619 self.handles: IOHandles | None = None -> 1620 self._engine = self._make_engine(f, self.engine)

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\urllib\request.py:604, in HTTPErrorProcessor.http_response(self, request, response) 601 # According to RFC 2616, "2xx" code indicates that the client's 602 # request was successfully received, understood, and accepted. 603 if not (200 <= code < 300): --> 604 response = self.parent.error( 605 'http', request, response, code, msg, hdrs) 607 return response

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\urllib\request.py:533, in OpenerDirector.error(self, proto, *args) 531 if http_err: 532 args = (dict, 'default', 'http_error_default') + orig_args --> 533 return self._call_chain(*args)

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\urllib\request.py:466, in OpenerDirector._call_chain(self, chain, kind, meth_name, *args) 464 for handler in handlers: 465 func = getattr(handler, meth_name) --> 466 result = func(*args) 467 if result is not None: 468 return result

File c:\Users\yafar\AppData\Local\Programs\Python\Python313\Lib\urllib\request.py:613, in HTTPDefaultErrorHandler.http_error_default(self, req, fp, code, msg, hdrs) 612 def http_error_default(self, req, fp, code, msg, hdrs): --> 613 raise HTTPError(req.full_url, code, msg, hdrs, fp)

HTTPError: HTTP Error 429: Too Many Requests Output is truncated. View as a scrollable element or open in a text editor. Adjust cell output settings...

1 respuesta

Hola Yandira,

Parece que te estás enfrentando a un error 429, que indica que el servidor de GitHub ha recibido demasiadas solicitudes en un corto período de tiempo, y por eso está bloqueando temporalmente el acceso. Esto es muy común cuando abres el notebook directamente desde GitHub (por ejemplo, en Google Colab) y ejecutas varias veces las líneas que cargan datos con pd.read_csv("https://raw.githubusercontent.com/..."). Aquí hay algunas sugerencias que podrían ayudarte a resolver este problema:

  1. Esperar un poco: A veces, simplemente esperar unos minutos puede resolver el problema, ya que el servidor puede levantar la restricción después de un tiempo.

  2. Descargar los archivos manualmente: Puedes descargar los archivos CSV directamente desde GitHub y luego cargarlos localmente en tu script. Aquí te dejo un ejemplo de cómo podrías hacerlo:

    • Descarga los archivos CSV desde GitHub y guárdalos en tu computadora.

    • Modifica tu código para cargar los archivos desde tu sistema local, por ejemplo:

      import pandas as pd
      
      tienda = pd.read_csv('ruta/local/tienda_1.csv')
      tienda2 = pd.read_csv('ruta/local/tienda_2.csv')
      tienda3 = pd.read_csv('ruta/local/tienda_3.csv')
      tienda4 = pd.read_csv('ruta/local/tienda_4.csv')
      
      tienda.head()
      

    Asegúrate de reemplazar 'ruta/local/tienda_1.csv' con la ruta correcta donde guardaste los archivos en tu computadora.

Espero que alguna de estas opciones te ayude a seguir adelante con tu modelado de datos.

No dudes en volver al foro si tienes alguna pregunta o dificultad. Abrazos y buenos estudios!

Por favor, no olvides marcar este post como solucionado. ¡Es de gran ayuda para la comunidad! ✓ Sigue adelante con tus estudios.