python 18

[python] List 두 인자 위치 변경하기(스와프, swap)

Python에서 리스트(List)에서 두 요소의 위치를 바꾸려면 다음과 같이 할 수 있다. 간단한 방법으로 두 변수의 값을 서로 교환하면 된다. 예를 들어, 리스트 my_list에서 인덱스 i와 인덱스 j의 값을 바꾸려면 다음과 같이 할 수 있다. my_list = [1, 2, 3, 4, 5] # 인덱스 1과 인덱스 3의 값 바꾸기 i, j = 1, 3 my_list[i], my_list[j] = my_list[j], my_list[i] print(my_list) # [1, 4, 3, 2, 5] python의 swap 기능을 사용하면 두 변수의 값을 간단하게 교환할 수 있고, 새로운 변수를 만들지 않아도 되는 장점이 있다. 그리고 두개 이상, 세개, 네개 인자도 위치 변경이 가능하다.

[python] lambda 함수로 한줄 함수 만들기

개념 및 구문 Lambda 함수는 파이썬에서 익명 함수(anonymous function)를 생성하는 방법 중 하나입니다. Lambda 함수는 간단한 함수를 정의할 때 사용되며, 일반적으로 한 줄로 작성됩니다. Lambda 함수는 함수 정의를 간결하게 표현할 때 유용합니다. lambda arguments: expression `arguments`: 함수에 전달할 매개변수(인자)를 나타냅니다. `expression`: 인자를 받아 처리하고 결과를 반환하는 표현식을 나타냅니다. Lambda 함수는 주로 함수의 인자로 전달되거나, 간단한 함수를 인라인으로 정의할 때 사용됩니다. Lambda 함수는 간단한 작업을 수행할 때 유용하지만, 복잡한 작업을 처리하기 위해서는 일반적인 함수를 정의하는 것이 더 적합할 수..

[python] isdigit, isnumeric, isdecimal, isalpha, isalnum 함수로 문자 숫자 확인하기

Python isdigit 함수 isdigit 함수는 문자열이 숫자로만 이루어져 있는지 여부를 확인하는 메서드입니다. 이 함수는 문자열 내의 모든 문자가 숫자 문자(0-9)로만 구성되어 있을 때 True를 반환하고, 그렇지 않을 경우 False를 반환합니다. 사용법 text = "12345" result = text.isdigit() print(result) # 출력: True주의 사항 isdigit 함수는 문자열이 모든 문자가 숫자인지를 검사합니다. 따라서 소수점, 음수 기호, 지수 표기법 등의 추가 문자가 있는 경우 False를 반환합니다. 공백 문자 또는 다른 문자(예: "$", ",", "A" 등)가 포함되어 있으면 isdigit 함수는 False를 반환합니다. text1 = "12345" tex..

[python] zip() 내장함수 활용예제

zip은 파이썬의 내장 함수 중 하나로, 여러 개의 iterable(반복 가능한 객체)을 받아서 해당 iterable들에서 동일한 위치에 있는 요소들을 묶어 새로운 iterable을 생성합니다. 각 입력 iterable의 길이가 다를 경우, zip은 가장 짧은 iterable의 길이에 맞춰 짝을 지어줍니다. zip(iterable1, iterable2, ...) 여기서 iterable1, iterable2, ...은 두 개 이상의 iterable 객체를 나타내며, zip 함수는 이러한 iterable들을 조합하여 새로운 iterable을 생성합니다. 예제 1: 두 리스트 묶기 names = ['Alice', 'Bob', 'Charlie'] scores = [90, 85, 88] zipped = zip(n..

[python] list를 정렬하는 sort, sorted 함수 차이?

Python에서 sort와 sorted 함수는 둘 다 리스트를 정렬하는 데 사용되는 함수입니다. 그러나 이 두 함수 간에 중요한 차이점이 있습니다. sort 함수: sort 함수는 리스트를 제자리에서(in-place) 정렬합니다. 즉, 원래의 리스트를 변경하고 새로운 리스트를 생성하지 않습니다. sort 함수는 아무것도 반환하지 않습니다. 정렬된 결과는 원래 리스트에 적용됩니다. my_list = [3, 1, 2] my_list.sort() print(my_list) # 출력: [1, 2, 3] sorted 함수: sorted 함수는 원래 리스트를 변경하지 않고 새로운 정렬된 리스트를 반환합니다. 정렬된 결과를 다른 변수에 할당하여 사용할 수 있습니다. my_list = [3, 1, 2] sorted_l..

문자열 다루기 - strip 함수, split 함수 차이

strip 함수 주어진 문자열의 양 끝에서 특정 문자나 공백을 제거 문자열을 수정하지 않고 새로운 문자열을 반환 괄호 안에 특정 값을 넣을 경우에는 해당하는 문자열을 제거 strip 함수에는 rstrip, lstrip, strip으로 총 3가지 rstrip은 오른쪽에 있는 것만(공백 or 특정 문자) 제거하고, lstrip은 왼쪽에 있는 것만 제거하고, strip은 양쪽 다 제거한다. text = "^ Hello, World! ^" stripped_text = text.strip('^') lstripped_text = text.lstrip('^') rstripped_text = text.rstrip('^') print(text) print(stripped_text) print(lstripped_text)..

[PySpark] round(반올림), ceil(올림), floor(내림) 함수로 소수점 자리까지 다루기

PySpark를 사용하여 DataFrame의 특정 컬럼을 반올림, 올림 또는 내림하는 방법은 round(), ceil(), floor() 함수를 사용한다. PySpark의 ceil 및 floor 함수는 기본적으로 특정 소수 자릿수에서 동작하지 않는다. 특정 소수 자릿수에서 올림 또는 내림을 수행하려면 먼저 원하는 소수 자릿수로 값을 곱한 다음, 올림 또는 내림한 후에 다시 나누는 방법을 사용해야 한다. 즉, 원하는 자릿수 만큼 곱해서 올림이나 내린 다음에 다시 자릿수 만큼 나눠주는 작업이 필요하다. 0.참고사항 from pyspark.sql.functions import expr # DataFrame에서 "value" 컬럼을 소수점 둘째 자리로 올림 df = df.withColumn("ceiled_val..

[PySpark] 학습된 로지스틱 모형의 계수 확인하기.

우선, 모델의 학습에 필요한 train, test 셋이 있다는 가정하에 다음과 같이 3차 교호법(3 fold crossvaildaition)을 통해 로지스틱 모형을 학습하고 test 데이터 셋에 스코어링 하는 코드이다. pyspark에서 로지스틱 모형의 파라미터 옵션은 https://runawayhorse001.github.io/LearningApacheSpark/reg.html 10. Regularization — Learning Apache Spark with Python documentation 10. Regularization In mathematics, statistics, and computer science, particularly in the fields of machine learning..

파이썬 list에서 특정 문자열을 포함하는지 확인하고 제거하기.

1.특정문자열 포함 확인 파이썬에서 리스트 내에 특정 문자열을 포함하는지 확인하는 방법은 다음 네가지를 고려할 수 있다. 대소문자를 무시하려면 비교시 대문자 또는 소문자로 통일후 진행 1) 반복문 사용 def contains_string(lst, target): for item in lst: if target in item: return True return False my_list = ["apple", "banana", "cherry"] target_string = "bana" result = contains_string(my_list, target_string) print(result) # True 2) any() 함수와 list 컴프리헨션 사용 my_list = ["apple", "banana", ..

[PySpark] array_intersect로 array간 같은 value값 찾기

다음과 같은 'data'라는 데이터 프레임이 있다. 그리고 데이터 프레임에 collect_list(site_app)이라는 array 구조의 컬럼이 있는데 해당 컬럼에서 list_A의 list value 값이 몇개가 있는지 궁금하다. data = [("oaid_1", ["app1", "app2", "app3"], [10, 20, 30], [1, 2, 3]), ("oaid_2", ["app2", "app4", "app5"], [15, 25, 35], [2, 4, 5]), ("oaid_3", ["app1", "app3", "app4"], [12, 22, 32], [1, 3, 4])] # Create a DataFrame with the sample data columns = ["oaid", "collect_l..