프로그래밍/Python

[pandas] 날짜차이 컬럼 생성하기

히또아빠 2023. 5. 24. 17:00

판다스 데이터 프레임에서 특정 고정 날짜와 datetime64 열 사이의 기간을 나타내는 새 열을 만들려면 datetime64 열에서 고정 날짜를 뺄 수 있습니다. 그러면 고정 날짜와 각 날짜 시간 값 사이의 시간 차이를 나타내는 time delta64 데이터 유형이 생성된다.

import pandas as pd

# Example DataFrame
df = pd.DataFrame({'Date': ['2023-05-10', '2023-05-11', '2023-05-12'],
                   'Time': ['09:00:00', '10:30:00', '14:15:00']})

# Convert 'Date' and 'Time' columns to datetime64 type
df['Date'] = pd.to_datetime(df['Date'])
df['Time'] = pd.to_datetime(df['Time']).dt.time

# Define the fixed date
fixed_date = pd.to_datetime('2023-05-10')

# Calculate the duration
df['Duration'] = df['Date'] - fixed_date

# Display the DataFrame
print(df)

        Date      Time Duration
0 2023-05-10  09:00:00   0 days
1 2023-05-11  10:30:00   1 days
2 2023-05-12  14:15:00   2 days

이 예에서는 날짜 및 시간 값을 나타내는 '날짜'와 '시간'이라는 두 개의 열이 있는 데이터 프레임워크가 있다. 먼저 pd.to _datetime()을 사용하여 'Date' 열을 datetime64 데이터 유형으로 변환한다. 또한 'Time' 열을 datetime64 데이터 유형으로 변환하고 .dt.time을 사용하여 시간 성분을 추출하여 날짜 성분을 제거한다.

특정 날짜가 포함된 pd.to _datetime을 사용하여 고정 날짜를 정의한다.

그런 다음 '날짜' 열에서 고정 날짜를 빼서 고정 날짜와 각 날짜 값 사이의 기간 또는 시간 차이를 계산한다.

결과 'Duration' 열에는 고정 날짜와 각 날짜 값 사이의 시간 지속 시간을 나타내는 time delta64 값이 포함한다.

300x250
반응형