Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?

Forum >> Principianti >> Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?

Pagina: 1

Scritto da
Noreply Noreply

Messaggi: 10
Registrato il: 2019-01-04 11:25:24

2019-01-17 11:29:22 - Come creare un dataframe da una pagina html o da un ResultSet di beautifulsoup?

All'interno di un oggetto zuppa ho preso tutto il testo della divisione `inner_left2` dove ci sono articoli e date e voglio ottenere tutti gli articoli e le date in un dataframe. Sembra che gli articoli e le date siano nel tag `span`. Allora ho fatto:

    page = requests.get('https://www.abcbourse.com/marches/news_valeur.aspx?p=1&s=DJIAx')
    # Create a BeautifulSoup object

    soup = BeautifulSoup(page.text, 'html.parser')

    actualites_ws = soup.find(class_='inner_left2')

    articles_list = actualites_ws.find_all('span')

Questo dà il seguente:

    [<span class="n12">DJIA - <a href="/marches/aaz.aspx?M=usau"><img alt="" class="tipt" height="12" src="/game/flag/US.gif" title="USA" width="18"/></a></span>,

     <span class="quote_upb"><img alt="" height="20" src="/5/quote_up_fl.png" width="30"/>0,57%</span>,

     <span class="lh24">

     <span class="mr5">16/01/19 22:30</span>

     <a href="wall-street-finit-en-hausse-goldman-sachs-et-bank-of-america-a-l-honneur_459575_DJIAx.aspx">Wall Street finit en hausse, Goldman Sachs et Bank of America à l'honneur</a> (AFP)<br/>

     </span>,

     <span class="mr5">16/01/19 22:30</span>,

     <span class="lh24">

     <span class="mr5">16/01/19 16:14</span>

     <a href="wall-street-soutenue-par-les-resultats-de-banques-ouvre-en-hausse_459537_DJIAx.aspx">Wall Street, soutenue par les résultats de banques, ouvre en hausse</a> (AFP)<br/>

     </span>,

    ...

Ma quando provo a trasformarlo in un dataframe, non funziona:

    >>>df = pd.read_html(articles_list)

    TypeError: Cannot read object of type 'ResultSet'

--- Ultima modifica di MikeI in data 2019-01-17 11:29:46 ---

Pagina: 1

Esegui il login per scrivere una risposta.