[카테고리:] Python

  • 파이썬 리스트, 배열, ndarray 비교

    주요 차이점 비교

    특징리스트 (list)배열 (array.array)ndarray (numpy.ndarray)
    데이터 타입혼합 가능동일한 타입만 저장동일한 타입만 저장
    차원1차원, 다차원은 중첩 구조로 표현1차원다차원 지원
    메모리 효율성상대적으로 비효율적효율적매우 효율적
    연산 속도느림빠름매우 빠름
    고급 연산미지원미지원지원 (벡터화, 선형대수, 통계 등)
    용도일반적인 데이터 저장 및 조작단순 숫자 데이터수학 연산, 대규모 데이터 분석
  • BeautifulSoup HTML 파싱 코드

    from urllib.request import urlopen
    from urllib.error import HTTPError
    from bs4 import BeautifulSoup
    
    def getBS(url):
        try:
            html = urlopen(url)
    
        except HTTPError as e:  #페이지를 읽을 수 없을 때 예외 처리
            print(e)
            return None
        
        try:
            bsObj = BeautifulSoup(html.read(),'html.parser')
    
        except AttributeError as e: #태그를 찾을 수 없을 때 예외 처리
            print(e)
            return None
        
        return bsObj

    기본 함수

    names = bsObj.find_all(name="span",attrs={"class":"green"})
    for name in names:
        print(name)

    span class가 green인 항목들을 모두 가져오기

  • 윈도우에서 파이썬 가상환경 만들기

    1. 원하는 버전의 파이썬 다운로드
    2. venv를 이용해서 가상환경 생성
    3. 가상환경 활성화/비활성화

    파이썬 다운로드

    Python Releases for Windows | Python.org에 접속해서 원하는 버전의 파이썬을 다운받아 설치한다. PATH 환경변수에 추가하는 것은.. 글쎄 굳이 필요가 없을 듯 하다. 어짜피 가상환경을 생성해서 거기서만 쓸 것이기 때문에.

    venv를 이용해서 가상환경 생성

    별다르게 설정을 하지 않았다면 파이썬이 설치되는 경로는 C:\Users\사용자명\AppData\Local\Programs\Python 이다.

    터미널을 열어서 다음과 같이 입력한다.

    C:\Users\사용자명\AppData\Local\Programs\Python\Python버전명\python.exe -m venv 원하는가상환경이름

    가상환경 활성화

    터미널에서 다음과 같이 입력한다

    ./가상환경이름/Scripts/Activate

    가상환경 비활성화

    터미널에서 다음과 같이 입력한다

    deactivate
  • Python Pandas

    import pandas as pd
    from sklearn.model_selection import train_test_split
    import pandas as pd
    from sklearn.model_selection import train_test_split
    sub Test(rngSource as range)
    
     dim i as Integer
     for i = 1 to 10
      code
     next i
    
    
    end sub