2020-02-10 게시 됨2022-08-27 업데이트 됨cslog18분안에 읽기 (약 2768 단어)

Linux, Unix 정리

Shorcut

자주 쓰는 명령어 모음

lshw: 하드웨어 스펙보기
예약변수: HOME, PATH, PWD, LANG, 등등

위치 매개 변수(Positional Parameters)

문자	설명
$0	실행된 스크립트 이름
$1	$1 $2 $3…${10}인자 순서대로 번호가 부여된다. 10번째부터는 “{}”감싸줘야 함
$*	전체 인자 값
$@	전체 인자 값($* 동일하지만 쌍따옴표로 변수를 감싸면 다른 결과 나옴)
$#	매개 변수의 총 개수

특수 매개 변수(Special Parameters)

문자	설명
$$	현재 스크립트의 PID
$?	최근에 실행된 명령어, 함수, 스크립트 자식의 종료 상태
$!	최근에 실행한 백그라운드(비동기) 명령의 PID
$-	현재 옵션 플래그
$_	지난 명령의 마지막 인자로 설정된 특수 변수

디버깅(Debugging)

간단하게는 echo, exit 명령나 tee 명령어로 디버깅한다.
다른 방법으로 실행 시 옵션을 주거나 코드에 한줄만 추가하면 해볼수 있다.

Bash 옵션(스크립트 실행 시)	set 옵션(스크립트 코드 삽입)	설명
bash -n	set -n, set -o noexec	스크립트 실행없이 단순 문법 오류만 검사(찾지 못하는 문법 오류가 있을수 있음)
bash -v	set -v, set -o verbose	명령어 실행전 해당 명령어 출력(echo)
bash -x	set -x, set -o xtrace	명령어 실행후 해당 명령어 출력(echo)
	set -u, set -o nounset	미선언된 변수 발견시 “unbound variable” 메시지 출력

배열(Array Variable)

배열 변수 사용은 반드시 괄호를 사용해야 한다.(예: ${array[1]})
참고: 1차원 배열만 지원함

# 배열의 크기 지정없이 배열 변수로 선언
# 참고: 'declare -a' 명령으로 선언하지 않아도 배열 변수 사용 가능함
declare -a array

# 4개의 배열 값 지정
array=("hello" "test" "array" "world")

# 기존 배열에 1개의 배열 값 추가(순차적으로 입력할 필요 없음)
array[4]="variable"

# 기존 배열 전체에 1개의 배열 값을 추가하여 배열 저장(배열 복사 시 사용)
array=(${array[@]} "string")

# 위에서 지정한 배열 출력
echo "hello world 출력: ${array[0]} ${array[3]}"
echo "배열 전체 출력: ${array[@]}"
echo "배열 전체 개수 출력: ${#array[@]}"

printf "배열 출력: %s\n" ${array[@]}

# 배열 특정 요소만 지우기
unset array[4]
echo "배열 전체 출력: ${array[@]}"

# 배열 전체 지우기
unset array
echo "배열 전체 출력: ${array[@]}"

반복문(for, while, until)

반목문 작성 시 아래 명령어(흐름제어)을 알아두면 좋다.
반복문을 빠져 나갈때: break
현재 반복문이나 조건을 건너 뛸때: continue

# 지정된 범위 안에서 반복문 필요 시 좋음
for string in "hello" "world" "..."; do;
    echo ${string};
done

# 수행 조건이 true 일때 실행됨 (실행 횟수 지정이 필요하지 않은 반복문 필요 시 좋음)
count=0
while [ ${count} -le 5 ]; do
    echo ${count}
    count=$(( ${count}+1 ))
done

# 수행 조건이 false 일때 실행됨 (실행 횟수 지정이 필요하지 않은 반복문 필요 시 좋음)
count2=10
until [ ${count2} -le 5 ]; do
    echo ${count2}
    count2=$(( ${count2}-1 ))
done

조건문(if…elif…else…fi)

조건문 작성 시 주의해야될 부분은 실행 문장이 없으면 오류 발생함

string1="hello"
string2="world"
if [ ${string1} == ${string2} ]; then
    # 실행 문장이 없으면 오류 발생함
    # 아래 echo 문장을 주석처리하면 확인 가능함
    echo "hello world"
elif [ ${string1} == ${string3} ]; then
    echo "hello world 2"
else
    echo "hello world 3"
fi

# AND
if [ ${string1} == ${string2} ] && [ ${string3} == ${string4} ]
..생략

# OR
if [ ${string1} == ${string2} ] || [ ${string3} == ${string4} ]
..생략

# 다중 조건
if [[ ${string1} == ${string2} || ${string3} == ${string4} ]] && [ ${string5} == ${string6} ]
..생략

문자열 인덱싱:
- https://superuser.com/questions/1033273/bash-4-3-substring-negative-length-on-os-x
- 맥에서는 -1 이런게 잘 안먹혀서 ${STR:6:$#-1} 이런식으로 해야하는듯
문자열 짜르기:
- https://www.tutorialkart.com/bash-shell-scripting/bash-split-string/

파일 합치기:

1	cat part-000 part_blog_normal_doc_20030317 > part_blog_normal_concat

0-9 사이 숫자만 변경되는 패턴 찾기:
- https://recipes4dev.tistory.com/157
- grep "STR[0-9]" *
문자열 뒤에서 짜르기
- rev 두번쓰는건 좀 느림..
- parameter expansion을 쓰자
  - 참고: https://blog.gaerae.com/2015/01/bash-hello-world.html

# 뒤에꺼만 짜르기
last=${data%,*}
d3b028:~/test_200225$ echo $last
# 결과: foo,bar,baz


# 뒤에꺼만 냅두기
data=foo,bar,baz,qux
last=${data##*,}

# 결과: qux

문자열 중간 짜르기
- ref: https://stackoverflow.com/questions/5683367/how-to-cropcut-text-files-based-on-starting-and-ending-line-numbers-in-cygwin
큰 파일 짜르기
- ref: https://linoxide.com/linux-how-to/split-large-text-file-smaller-files-linux/
- https://askubuntu.com/questions/54579/how-to-split-larger-files-into-smaller-parts

1	split -l 라인수 파일 (옵션은 추후 참고)

tab으로 짜르기
- https://linuxhint.com/20_awk_examples/#a4
파일내의 단어 문자수 세기
- ref: https://leeahnlee.tistory.com/14
- -c : 전체 문자의 수를 출력
- -l : 전체 라인의 수를 출력
- -w : 전체 단어의 수를 출력

wc -l 파일명

큰 파일 label 기준으로 짜르기

# label 2 기준으로 몇라인인지 숫자세기
cat _blog_all_title_total.txt | grep -w $'\t2' | wc -l
# 또는 # label 8192 기준으로 몇라인인지 숫자세기
cat _blog_all_title_total.txt | grep -w $'\t8192’ | wc -l

ref:
- https://recipes4dev.tistory.com/157
- https://stackoverflow.com/questions/9954515/grep-find-lines-that-contains-t
기타 Notation
- $# csh, sh 스크립트 할 arguments의 갯수
  -ref: https://idchowto.com/?p=11930

grep

grep엔 메타문자가 있음
- ^: 라인의 시작
블로그 파일을 gdid grep으로 분류하고 싶다면 다음과 같이하면 됨
1
cat imp_log.txt | grep ^90000003_ > blog_imp_log.txt

sort & join

파일을 join 하려면 우선 sort 를 해야됨

sort: https://goitgo.tistory.com/15
- sort하려는데 저장공간이 없다고 뜰때: https://www.linuxquestions.org/questions/linux-newbie-8/sort-big-files-tmp-sorta3aljf-no-space-left-on-device-823971/
join: https://m.blog.naver.com/PostView.nhn?blogId=zzeun&logNo=130186967794&proxyReferer=https:%2F%2Fwww.google.com%2F

1	sort 파일명 > sorted_파일명.txt

join 할땐 여러가지 옵션이 있음
우선 key값은 sep 기준으로 맨 앞에 있는게 보통임 (비교할 key 값은 옵션으로 지정가능)

1	join 파일1 파일2 > joined_파일3.txt

만약 join되지 않는 라인만 출력하고자 한다면 다음과 같이하면 됨 (파일1에서 join되지 않는 라인 출력)

1	join -v 1 file1 file2 > not_joined_file3.txt

rsync

Rsync(Remoe Sync)는 원격에 있는 파일과 디렉토리를 복사하고 동기화 하기 위해서 사용하는 툴이며 동시에 네트워크 프로토콜임
Rsync는 CLI툴로, 커맨드 라인의 옵션들을 이용해서 배치 프로그램을 개발하기 쉬다는 장점이 있다. 이 스크립트를 cron 등에 올리는 걸로 간단하게 백업 혹은 미러(mirror) 시스템을 구축할 수 있음
장점
- 원격 시스템으로 부터 파일을 효율적으로 복사하거나 동기화 할 수 있음
- Link, device, 파일의 소유자와 그룹 권한(permissions)등 파일의 부가정보도 복사할 수 있음
- scp보다 빠름 (rsync는 remote-update 프로토콜을 이용해서 차이가 있는 파일만 복사함. 처음엔 다 복사하니 비슷할수도)
- 데이터를 압축해서 송/수신하기 때문에 더 적은 대역폭을 사용
알고리즘
- 기본적으로 rsync는 파일의 크기와 수정 시간(modification)을 비교하는 것으로 파일을 전송할지 말지를 결정함
- –checksum 옵션을 이용하면 비교 방법을 개선할 수 있다. 이 옵션을 켜면, 파일의 checksum을 비교한다. 크기/시간을 이용한 비교 방법보다 안전하지만 더 느리고 더 많은 자원을 사용
- Rsync는 파일을 고정 크기를 가지는 청크(chunk)로 나눈다음에 checksum을 계산한다. 이 checksum을 서로 계산해서, 다를 경우 해당 부분의 청크만을 복사한다.
  만약 파일의 앞 부분의 정보가 수정돼서 정보들이 밀린다면 모든 청크의 checksum이 어긋날 것이다. 이 문제를 피하기 위해서 “Rolling hash”를 사용
출처: https://skibis.tistory.com/16

rsync 사용법 시나리오

https://blueyikim.tistory.com/562

rsync 속도제한

실 서비스에서 무언가를 가져오거나 적용할 땐 느린속도로 해주는게 좋음
-bwlimit 옵션이 있고 단위는 kb/s 임 (아래 예는 600KB/s) (원격에서 로컬로 (rsync from to 로 보면됨))

rsync -avz --progress --bwlimit=600 원격계정@원격ip:원격경로 로컬경로

파일 복사하지 않고 디렉토리 구조를 속도 제한해서 복사

rsync -av --progress --bwlimit=600 -f"+ */" -f"- *" 복사주는곳 복사받는곳

Practical Unix

프로젝트를 하다보니 얼추 쓸수는 있게 되었는데 뭔가 디테일이 부족하다고 느끼던 차, 스탠포드에서 강의가 있는걸 알게되서 한번 빠르게 정주행해야곘다 생각했습니다. 아래에 간단하게 정리했습니다.

command set: https://www.tjhsst.edu/~dhyatt/superap/unixcmd.html

video:
https://practicalunix.org/video-schedule

week 2: Intro

사용할 shell (bash, zsh 등등)정하기
사용할 eiditor (vim, emacs) 배우기
shell과 editor 커스터마이징하기 (dot file! ex .zshrc)
github에 올려놓고 자유롭게 저장, 바꿔쓰기

참고로 난 macOS / iTerm / zsh 환경에서 작업 중
https://practicalunix.org/content/week-2-intro

week 3: Pipelines - Input/Output Redirection

입출력 대상을 표준 입력(stdin), 표준 출력(stdout), 표준 오류(sterr)를 쓰지 않고 다른 경로인 파일로 재지정 하는 것

표준 입력 재지정(Input Redirection)

키보드 입력(표준 입력)을 파일에서 받도록 대체하는 것
“<” 연산자를 사용해서 키보드로 연결된 표준 입력 방향으로 파일로 변경(명시적)
cat 명령어를 사용하는 것과 동일한 결과

표준 출력 재지정(Output Redirection)

명령의 실행 결과나 에러 상황을 화면에 출력하지 않고 바로 파일로 저장
“>” 연산자를 파일명 앞에 지정하여 사용함
“>” 연산자로 출력방향을 지정할 때 목적 파일은 항상 처음부터 다시 작성됨(파일 덮어씀)
“>>” 연산자를 사용하면, 존재하지 않는 파일이면 “>”과 마찬가지로 파일이 생성되고, 파일이 있는 경우에는 이어서 작성 됨

표준 오류 재지정(Error Redirection)

리다이렉션 연산자가 필요없음 (이부분은 아직 잘 모르겠음)

파이프(Pipe), 파이프라인(Pipeline)

둘 이상의 명령을 함께 묶어 출력의 결곽 다른 프로그램의 입력으로 전환하는 기능임
즉, 명령어의 표준출력을 또 다른 명령어의 표준 입력과 연결 시킬 수 있음
명령어와 명령어의 연결은 "|" 기호를 사용함
"|" 기호 앞의 명령 결과가 "|" 기호 뒤의 명령에 입력 데이터로 사용됨

1	ls /bin /usr/bin \| sort \| uniq \| grep zip

1	python read-input.py < nums-0-999 >> result.txt

기타 명령어

‘head’, ‘tail’ : 파일의 시작, 끝을 보여줌
‘tr’
‘sort’
‘uniq’
‘cut’
‘join’
‘sed’
‘awk’
‘tee’

http://eunguru.tistory.com/89
https://practicalunix.org/content/week-3-pipelines

week 4: Grep and Regular Expressions

Reference

https://blog.gaerae.com/2015/01/bash-hello-world.html

Linux, Unix 정리

https://eagle705.github.io/2020-02-10-Practical-Linux-Unix/

Author

Joosung Yoon

Posted on

2020-02-10

Updated on

2022-08-27

Licensed under

#linux

Linux, Unix 정리

Shorcut

위치 매개 변수(Positional Parameters)

특수 매개 변수(Special Parameters)

디버깅(Debugging)

배열(Array Variable)

반복문(for, while, until)

조건문(if…elif…else…fi)

grep

sort & join

rsync

rsync 사용법 시나리오

rsync 속도제한

파일 복사하지 않고 디렉토리 구조를 속도 제한해서 복사

Practical Unix

week 2: Intro

week 3: Pipelines - Input/Output Redirection

표준 입력 재지정(Input Redirection)

표준 출력 재지정(Output Redirection)

표준 오류 재지정(Error Redirection)

파이프(Pipe), 파이프라인(Pipeline)

기타 명령어

week 4: Grep and Regular Expressions

Reference

Author

Posted on

Updated on

Licensed under

댓글

카테고리

아카이브

태그

광고

카탈로그

최근 글