LLVM -3

System 2016.08.24 16:48

지난번 설치까지 끝을 냈다. 그럼 사용을 하는걸로 넘어가 보도록 하자.


1. clang? clang!


처음 설치하고 llvm을 실행해보려고 llvm 파일을 찾았더니 아무리 찾아도 없어서 상당히 당황했다.


여기저기 찾아본 결과, 실행파일명은 llvm이 아니라 clang 이라는걸 알기까지 다소 시간이 걸렸다.


우선 테스트 해볼 소스코드는 아래와 같이 간단하다



쓰이지도 않을 c라는 변수와 함께 HIHIHIHIIH를 출력하고 종료하는 단순한 프로그램이다.


이 프로그램을 각각 gcc와 clang(llvm)으로 컴파일 해 볼 예정이다.


우선 clang을 통해서 컴파일 한 것은 test,

gcc를 통해서 컴파일 한것을 test2으로 지정한 후, 두 파일의 opcodes 를 비교하는걸로 시작하자.


먼저 test ( clang )의 결과물이다.



60 라인( 실제로는 라인 수가 아니지만) 이 출력된 것을 볼 수 있다. 


이제 test2 (gcc)를 보도록 하자.


47 라인으로 끝나는 것을 볼 수 있다. 실제로 아래쪽의 코드가 c언어와 매칭하기 더욱 편한것을 느꼈다.


clang을 통해서 쓰는것이 좀더 쓸데없는? 코드를 더 넣는것 같다.



2. 난독화


llvm을 접하게 되면서 가장 관심이 깊었던건 역시 난독화 분야이다. 이 난독화를 테스트 해보기위해 여기저기 뒤진결과 공식 페이지에 사용방법이 나와있는것을 발견했다.



해당 옵션들을 사용해서 두 파일의 난독화 정도를 비교하기 위해 소스코드를 조금만 더 복잡하게 짜서 테스트 해 보기로 하였다.



코드는 55809와 xor 한 결과값을 두고 문구를 출력하는 간단한 프로그램이다. 분기문이 있어야 될것 같아서 몇가지의 분기문을 추가하고 이 것을 컴파일 해 보았다.


우선 일반적으로 clang을 통해 컴파일 한 결과의 그래프는 아래와 같다



마지막 네모 4개를 보아서 저 부근이 switch 문으로 확인할 수 있다. 크게 복잡하지 않은 구조임을 한눈에 확인 할 수 있다.


이제 모든 옵션을 가미한 결과물의 그래프를 보자.



보기만해도 상당히 암이 걸린다. 위에서 적었다 시피 코드가 크게 복잡하지 않음에도 불구하고 이렇게 암걸리는 코드를 생성해 낼 수 있다.


이걸 NDK에 적용하려고 생각하니 벌써부터 신이 난다


3. 일단 마무리


NDK 설정을 해줘야 하기도하고, 이것을 따로 적용시켜주기도 해야하고.. 다음 포스팅까지는 아마 시간이 길게 걸릴것 같다.



----------------------------------------------------------------------------------------------------------------------------------------------

Reference


NOP


'System' 카테고리의 다른 글

How 2 heap - fastbin_dup.c  (0) 2017.05.16
How 2 heap - first_fit.c  (0) 2017.05.15
LLVM -3  (2) 2016.08.24
LLVM - 2  (0) 2016.08.17
LLVM - 1  (0) 2016.08.12
프로그램에서 일어날수 있는 레이스컨디션의 예제  (8) 2015.04.01
Posted by Maid:: IzayoiSakuya

LLVM - 2

System 2016.08.17 10:35

LLVM 이 무엇인지 알았으니 간략히 설치를 해 보려 한다.


자세한 설치법은.. 역시 공식 사이트를 참조 하는게 가장 좋지만, 그게 귀찮고 힘든 사람들을 위해서 따로 적는것도 나쁘지 않다고 생각한다.


1. LLVM Source Download


16년 8월 17일 현재시간을 기준으로 가장 최근에 올라와 있는 버전은 3.8.1 이다. 하지만 여기서는 Android Obfuscate 를 목적으로 LLVM을 설치하고 있으므로..


3.6.1 버전을 기준으로 설치를 시작한다. 물론, 다른 버전도 설치 방법은 여타 동일하다.


우선은 다운로드 페이지 로 이동해서 3.6.1 버전의 llvm 소스와 clang 소스를 받자.



다른버전을 사용하실 분들께서는 다른버전의 Clang과 LLVM을 받아주시면 된다. 중요한것은, 해당 버전에 맞게 받아 주어야 한다는 것이다.


llvm을 받아서 커스터마이징을 해보고 싶은 분들은 위의 방법과 같이 소스를 받으시면 되고,


난독화를 위해 이미 만들어진 llvm을 사용하시고 싶은 분들은  GIT으로 그 소스가 제공되고 있으며, git clone -b llvm-3.6.1 https://github.com/obfuscator-llvm/obfuscator.git 명령어 입력으로 다운로드 받을 수 있다.


설치방법은 이하 동일하기 때문에 큰 상관이 없다!


2. 설치하기


일단 LLVM의 소스코드를 적절한 디렉토리에 풀고 나면 해당 경로 내부에 tools 라는 폴더가 있다.


이 폴더 안에 Clang의 소스코드를 풀도록 하자.


LLVM

   - Tools

       -Clang

           -Clang의 내용물


의 형태가 되도록 풀어 주어야 한다.

tar 형식으로 되어 있으니 tar -xvf 명령어 등을 사용하여 풀면 된다.


3. 컴파일 시작! 전에


설치 가이드 에서는 cmake를 사용하고 있다. cmake 버전 또한 높은 버전을 요구하므로 cmake의 소스를 받아서 컴파일을 먼저 해 주도록 하자.


여기에서 그 소스들을 다운 받을수 있으며, 간단하게 ./configure 와  make를 실행하는것으로 cmake의 컴파일이 끝난다.


4. 본격적인 컴파일


모든 준비가 되었으면 LLVM 소스코드 폴더 바깥에 임의의 폴더를 하나 만들자. 설치 가이드 에서는 build 라는 폴더로 만들었으니 우리도 친절하게 mkdir build 라고 적어주자.

이제 이 경로에서 cmake -G "Unix Makefiles" ../llvm코드경로 를 입력해 주면 여러 메세지가 나오면서 마지막에 Configure가 완료 되었다고 뜬다.

이후 make 명령어를 입력하여 최종 컴파일에 돌입하자.



컴파일이 쭉쭉 진행되고 있다. 덧붙여서 해당 컴파일은 시간이 상당히 오래 걸리므로 충분히 쉬다가 오셔도 상관 없을것 같다.


-----------------------------------------------

Referer : http://cd80.tistory.com/97

'System' 카테고리의 다른 글

How 2 heap - fastbin_dup.c  (0) 2017.05.16
How 2 heap - first_fit.c  (0) 2017.05.15
LLVM -3  (2) 2016.08.24
LLVM - 2  (0) 2016.08.17
LLVM - 1  (0) 2016.08.12
프로그램에서 일어날수 있는 레이스컨디션의 예제  (8) 2015.04.01
Posted by Maid:: IzayoiSakuya

LLVM - 1

System 2016.08.12 13:44

0. Intro


주변에서 LLVM에 대한 소문이 무성히 들려온다.


이런저런 사정으로 LLVM을 손대봐야 하는 상황까지 와버려서, 설치부터 실행, 응용까지 차근차근 겪은일들, 해결한 방법 등을 적어 나가려 한다.


우선 LLVM이 무엇인지 알아야 하는데.. 검색으로도 LLVM이 무엇인지 알수 있다.


Low Level Virtual Machine 이라고 하는데.. 뭐 구구절절한건 집어치우고 일단 본론만 들어가자.



1. 왜 LLVM인가?


일단 LLVM이 무슨 프로그램인가 하고 굳이 분류를 나누자면 컴파일러 인 것 같다. 이런저런 글들을 다 살펴보아도 컴파일러에 관한 이야기 밖에 없다.


그럼 평소에 우리가 쓰는 gcc와 같은 컴파일러와 무엇의 차이점이 있는것인가?


이는 어쩔수 없이 흔한 그림으로 대체하여 설명하려 한다.


다소 거부감이 있더라도 최대한 이해한대로 쉽게 풀어 쓸 테니 양해하고 읽으면 좋겠다.


 

출처 : http://kyejusung.com/


글쓴이는 컴파일러에 대한 공부를 한 적이 없다. 그래서 알고있는것은 gcc source.c -o output 정도.


내가 저렇게 명령어를 입력하고 gcc를 실행시키면, 내부적으로는 위의 그림처럼 3단계를 거쳐서 ouput이 나온다고 한다.


모두가 알다시피 우리가 사용하는 프로그래밍 언어는 컴퓨터가 알아듣지 못한다. 이를 기계어로 번역하는 일을 컴파일러가 도맡아 하는데, 이때 몇가지의 과정이 있다.



- Frontend 

 해당 단계에서는 우리가 쓴 프로그래밍 언어를 분석하고 중간코드를 생성한다. LLVM에서는 중간코드를 IR 이라고 부르는 모양이다.


-Optimizer 

 단계 이름 그대로 최적화를 위한 중복계산을 제거하거나 여러가지 변환을 실행한단다.


-BackEnd

 코드를 타겟에 맞는 기계명령어로 매핑하고 실행코드를 생성한다. 



이렇게 3단계를 거쳐서 우리는 output 이라는 컴파일 결과물을 얻을수 있다.


물론, 우리가 자세히 알필요는 없었다. 우리가 필요한건 결과물이지 그 중간과정이 필요한게 아니었으니까. 내가 명령어를 넣으면, 결과물이 나온다. 

이게 글쓴이가 알고있던 컴파일러였다.


LLVM은 쓸데없이 이 3단계를 따로 분리 해 둔 컴파일러이다.


출처 : http://kyejusung.com/



나올 결과물만 보면 이전의 그것들과 다를것이 없다. 우리는 평범하게 소스코드 파일을 입력으로 줄것이고, LLVM은 이것을 컴파일해서 결과물을 가져올 것이다.


이제 겉은 그만 보고 조금만 안으로 들여다보면, LLVM의 잔머리에 감탄할 수도 있다.


LLVM은 중간코드(이하 IR)를 만들고 이를 각 아키텍쳐(타겟)에 맞는 명령어 셋으로 변환 할수 있다.


더이상 크로스컴파일 같은것에 얽매일 필요가 없다는 뜻이다.


사실 이 내용을 처음 접했을때는 여러가지 크로스 컴파일을 덕지덕지 붙여논것이라고 생각했다. 하지만 여기서 LLVM은 한술 더 뜬다


아키텍쳐에 맞는 명령어셋을 IR코드로 변환 가능하다


IR을 명령어로, 명령어를 IR로 바꿀수 있는것은 아마 생각하지 못한 여러가지 이점을 가져올수 있다. 악성코드 분석이든, 개발이나 어느방향이든.



개인적인 사정을 떠나서 LLVM이 어떻게 동작할지, 어떻게 다룰수 있을지에 대해서 흥미가 붙었다.


다음 해야할 일은 LLVM을 설치하고.. 이것을 어떻게 사용할지, IR은 어떻게 보는지, 그리고 정말 결과물을 내가 IR코드로 되돌릴수 있는지에 대해서 테스트 해 볼 생각이다.

'System' 카테고리의 다른 글

How 2 heap - fastbin_dup.c  (0) 2017.05.16
How 2 heap - first_fit.c  (0) 2017.05.15
LLVM -3  (2) 2016.08.24
LLVM - 2  (0) 2016.08.17
LLVM - 1  (0) 2016.08.12
프로그램에서 일어날수 있는 레이스컨디션의 예제  (8) 2015.04.01
Posted by Maid:: IzayoiSakuya