반응형
pandas의 read_csv로 데이터를 불러올 때, parsing errorr가 발생하는 경우... 해결하기 어려웠다
구글링 했을 때 read_csv() 안에 인자로 enging='python'을 사용하는 방법, skipfooter=1을 사용하는 방법 등이 있었지만 계속 아래와 같은 에러들이 발생함.
내가 겪은 에러구문
pandas.errors.ParserError: unexpected end of data
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at row 3071
pandas.errors.ParserError: unexpected end of data. Error could possibly be due to parsing errors in the skipped footer rows (the skipfooter keyword is only applied after Python's csv library has parsed all rows).
해결방법은 on_bad_lines='skip'을 입력하면 에러가 나는 행을 건너뛰고 잘 된다.
구글링 했을 때는 자꾸 error_bad_lines=False를 사용하라는데 이 인자는 deprecated되었음.
data = pd.read_csv(file_path, engine='python', on_bad_lines='skip', encoding='utf-8-sig')
반응형
'DS > Python' 카테고리의 다른 글
[Python] Vscode에서 MariaDB 설치 (1) | 2023.10.08 |
---|---|
[Python] VSCODE에서 원하는 버전의 Cuda-toolkit 설치 (0) | 2023.09.29 |
[Python] KMeans 사용시 맥북에서 에러 나는 경우 (0) | 2023.06.08 |
[Python] skimr 대신 skimpy (0) | 2023.06.01 |
[Python] Selenium 이용한 Googlemap 크롤링 (0) | 2023.05.25 |