문자열 3

[python] 문자열에서 특정 문자열 찾기(find, index, rfind, rindex)

Python에서 문자열에서 특정 부분 문자열을 찾거나 위치를 찾는데 사용되는 메소드에는 find, index, rfind, rindex가 있다. find(substring, start, end): 부분 문자열 substring을 찾고, 처음 발견된 위치(index)를 반환 찾지 못할 경우 -1을 반환 start와 end 매개변수를 사용하여 검색 범위를 제한 sentence = "Hello, world!" index = sentence.find("world") print(index) # 출력: 7 index(substring, start, end): find와 비슷하지만, 부분 문자열이 없을 경우 ValueError를 발생 sentence = "Hello, world!" index = sentence.in..

[PySpark] 특정(여러) 문자열(strings)이 포함된 데이터 필터로 뽑아내기.

우선 데이터 프레임 내에서 한 string 스키마 구조의 컬럼에서 특정 문자열이 포함된 데이터를 filter로 걸러내는 코드는 아래와 같다. 아래에서는 search strings list에 있는 단어들을 포함하고 있는 데이터를 뽑아내는 방법이다. 여러 단어들이 아닌 한 단어를 포함하고 있는 데이터를 뽑고자 할때는 reduce 함수를 쓸 필요 없이 아래와 같이 pyspark 내장함수를 활용하면 된다. df.filter(col("col1").contains("기내용")) - 기내용이 포함된 데이터 산출 df.filter(~col("col1").contains("기내용")) - 기내용이 포함되지 않은 데이터 산출 from pyspark.sql import SparkSession from pyspark.sql...

파이썬 list에서 특정 문자열을 포함하는지 확인하고 제거하기.

1.특정문자열 포함 확인 파이썬에서 리스트 내에 특정 문자열을 포함하는지 확인하는 방법은 다음 네가지를 고려할 수 있다. 대소문자를 무시하려면 비교시 대문자 또는 소문자로 통일후 진행 1) 반복문 사용 def contains_string(lst, target): for item in lst: if target in item: return True return False my_list = ["apple", "banana", "cherry"] target_string = "bana" result = contains_string(my_list, target_string) print(result) # True 2) any() 함수와 list 컴프리헨션 사용 my_list = ["apple", "banana", ..