Forum
>>
Principianti
>>
Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?
Pagina: 1
Esegui il login per scrivere una risposta.
Pagina: 1
Scritto da Noreply Noreply |
2019-01-17 11:29:22 - Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?
|
All'interno di un oggetto zuppa ho preso tutto il testo della divisione `inner_left2` dove ci sono articoli e date e voglio ottenere tutti gli articoli e le date in un dataframe. Sembra che gli articoli e le date siano nel tag `span`. Allora ho fatto:
page = requests.get('https://www.abcbourse.com/marches/news_valeur.aspx?p=1&s=DJIAx') # Create a BeautifulSoup object soup = BeautifulSoup(page.text, 'html.parser') actualites_ws = soup.find(class_='inner_left2') articles_list = actualites_ws.find_all('span') Questo dà il seguente: [<span class="n12">DJIA - <a href="/marches/aaz.aspx?M=usau"><img alt="" class="tipt" height="12" src="/game/flag/US.gif" title="USA" width="18"/></a></span>, <span class="quote_upb"><img alt="" height="20" src="/5/quote_up_fl.png" width="30"/>0,57%</span>, <span class="lh24"> <span class="mr5">16/01/19 22:30</span> <a href="wall-street-finit-en-hausse-goldman-sachs-et-bank-of-america-a-l-honneur_459575_DJIAx.aspx">Wall Street finit en hausse, Goldman Sachs et Bank of America à l'honneur</a> (AFP)<br/> </span>, <span class="mr5">16/01/19 22:30</span>, <span class="lh24"> <span class="mr5">16/01/19 16:14</span> <a href="wall-street-soutenue-par-les-resultats-de-banques-ouvre-en-hausse_459537_DJIAx.aspx">Wall Street, soutenue par les résultats de banques, ouvre en hausse</a> (AFP)<br/> </span>, ... Ma quando provo a trasformarlo in un dataframe, non funziona: >>>df = pd.read_html(articles_list) TypeError: Cannot read object of type 'ResultSet' --- Ultima modifica di MikeI in data 2019-01-17 11:29:46 --- |
Pagina: 1
Esegui il login per scrivere una risposta.