Beispiel #1
0
def display_graphs():

    sample_data = pd.read_csv('201309_trip_data.csv')

    display(sample_data.head())

    # Display the first few rows of the station data file.
    station_info = pd.read_csv('201402_station_data.csv')
    display(station_info.head())

    # Process the data by running the function we wrote above.
    station_data = ['201402_station_data.csv']
    trip_in = ['201309_trip_data.csv']
    trip_out = '201309_trip_summary.csv'
    summarise_data(trip_in, station_data, trip_out)

    # Load in the data file and print out the first few rows
    sample_data = pd.read_csv(trip_out)
    display(sample_data.head())

    # Verify the dataframe by counting data points matching each of the time features.
    question_3(sample_data)
tripin = ['201309_trip_data.csv']
tripout = '201309_trip_summary.csv'
summarise_data(tripin, station_data, tripout)

# In[8]:

# Carregue os dados novamente mostrando os dados
## TODO: Complete o código para leitura dos dados no arquivo criado na função acima
sample_data = pd.read_csv(tripout)
display(sample_data.head())

# In[9]:

# Verifica o DataFrame contando o número de pontos de dados com as características de
# tempo corretas.
question_3(sample_data)

# > **Dica**: se você salvar um notebook do jupyter, a saída dos blocos de código em execução também será salva. No entanto, o estado do seu arquivo será reiniciado uma vez que uma nova sessão será iniciada. Certifique-se de que você execute todos os blocos de código necessários da sessão anterior para restabelecer variáveis e funções antes de continuar de onde você deixou na última vez.

# ## Análise Exploratória de Dados
#
# Agora que você tem alguns dados salvos em um arquivo, vejamos algumas tendências iniciais nos dados. Algum código já foi escrito para você no script [babs_visualizations.py](babs_visualizations.py) para ajudar a resumir e visualizar os dados; Isso foi importado como as funções `usage_stats()` e `usage_plot()`. Nesta seção, vamos percorrer algumas das coisas que você pode fazer com as funções, e você usará as funções para você mesmo na última parte do projeto. Primeiro, execute a seguinte célula para carregar os dados. Depois preencha a célula abaixo com os comandos para verificar os dados básicos sobre os dados.

# In[10]:

trip_data = pd.read_csv('201309_trip_summary.csv')

# In[11]:

trip_data.head(6)
# **Question 3**: Run the below code block to call the `summarise_data()` function you finished in the above cell. It will take the data contained in the files listed in the `trip_in` and `station_data` variables, and write a new file at the location specified in the `trip_out` variable. If you've performed the data wrangling correctly, the below code block will print out the first few lines of the dataframe and a message verifying that the data point counts are correct.

# In[13]:

# Process the data by running the function we wrote above.
station_data = ['201402_station_data.csv']
trip_in = ['201309_trip_data.csv']
trip_out = '201309_trip_summary.csv'
summarise_data(trip_in, station_data, trip_out)

# Load in the data file and print out the first few rows
sample_data = pd.read_csv(trip_out)
display(sample_data.head())

# Verify the dataframe by counting data points matching each of the time features.
question_3(sample_data)


# > **Tip**: If you save a jupyter Notebook, the output from running code blocks will also be saved. However, the state of your workspace will be reset once a new session is started. Make sure that you run all of the necessary code blocks from your previous session to reestablish variables and functions before picking up where you last left off.
# 
# ## Exploratory Data Analysis
# 
# Now that you have some data saved to a file, let's look at some initial trends in the data. Some code has already been written for you in the `babs_visualizations.py` script to help summarize and visualize the data; this has been imported as the functions `usage_stats()` and `usage_plot()`. In this section we'll walk through some of the things you can do with the functions, and you'll use the functions for yourself in the last part of the project. First, run the following cell to load the data, then use the `usage_stats()` function to see the total number of trips made in the first month of operations, along with some statistics regarding how long trips took.

# In[14]:

trip_data = pd.read_csv('201309_trip_summary.csv')

usage_stats(trip_data)