Session 3 - Data-Orientation

Data Access

Joining datasets

We can join multiple datasets to improve our data access

For example, the postcode dataset can enrich the UK Price Paid data by adding coordinates information. We should join these datasets using the common aspects between them (i.e., postcode).

price_paid = pd.read_csv('pp-2020-part1.csv')
postcodes = pd.read_csv('open_postcode_geo/open_postcode_geo.csv')
merged_data = pd.merge(
    price_paid,
    postcodes,
    on='postcode',
    how='inner'
)
print("Original Price Paid dataset shape:", price_paid.shape)
print("Original Postcodes dataset shape:", postcodes.shape)
print("Merged dataset shape:", merged_data.shape)
print("\nSample of merged data:")
print(merged_data[['postcode', 'price', 'latitude', 'longitude']].head())
merged_data.to_csv('price_paid_with_coordinates.csv', index=False)

Data-Orientation

Last Time

The Problem First

The Problem First

The Problem First

The Problem First

The Problem First

The Problem First

The Systems Engineering Approach

The Systems Engineering Approach

The Systems Engineering Approach

The Systems Engineering Approach

The Systems Engineering Approach

Data

ML Definition

The "Technocentric" View

ML Definition

Data

Data

Data Challenges

Data Challenges

Data Challenges

Data Challenges

Data Challenges

Data Challenges

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

Data-Orientation

The Data Science Process

The Data Science Process

The Data Science Process

The Data Science Process

The Data Science Process

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Data Access

Conclusions

Conclusions