유전자분석

좌충우돌 BLAST+ 설치 방법

바로 어제까지만 해도 BLAST가 뭔지도 몰랐습니다. (유전자 서열 분석하는 도구라고 하네요…유전자 서열을 넣으면 어느 위치인지 찾아준대요~~>.,<)

BLAST 를 소스레벨에서 설치해보려고 합니다. (사실은 BLAST가 apt-get 으로 설치되는지 몰랐습니다…하하하…)

  •  참고 -BLAST 간편 설치 법  : sudo apt-get install ncbi-blast+
  •  거기다가 DB 업데이트 방법 :
    cd $BLASTDB
    sudo update_blastdb --passive --timeout 300 --force --verbose nr
    ls *.gz |xargs -n1 tar -xzvf
    rm *.gz.*
    
    
  • 거기다가 블라스트 DB 사용법 :
    blastp -db nr -query somesequence.fasta

 

  •  자세한 내용 : http://www.blopig.com/blog/2014/04/quick-standalone-blast-setup-for-ubuntu-linux/ 요기를 참고 하세요~

일단 다운로드 받고, (위치 : ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ 요기에서 ncbi-blast-2.7.1+-src.tar.gz 를 받았습니다. (x64를 받았어야 하나?)

압축을 풀고, ( 데스크탑 버전이라 압축관리자가 알아서 풀어주네요. 그래도 ‘tar -xzvf ncbi-blast-2.7.1+-src.tar.gz 이러면 풀릴껄요?)

./configure 하고 ( 위치 : ncbi-blast-2.7.1+-src/c++/ 아래에 있네요. )

cd ./c++/ReleaseMT/build/ 하고

/usr/bin/make all_r 이라고 하면 끝이라고 했는데…한 30분 컴파일 하더니 퍽 하구 에러가 나버렸네요. (캡쳐를 못했어요~~)

blast 에서  lmdb.h 이 파일을 못찾는다고 나왔습니다….

그래서~

sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev 이렇게 해줬는데…

다시 컴파일 하니 …/status/.lmdb.dep 타겟을 만들 규칙이 없습니다. 라고 뜨네요..

자 그럼 이제 뭘 해야 할까요?

 

일단 비쥬얼스튜디오에서 처럼 외부파일에 문제가 발생했을 경우, 리빌드할 때 빌드폴더를 날려버린 기억이 있어서 build 폴더를 날려버렸습니다.

그리고 다시 ./configure 부터 실행 한 후 make 하니까 드디어 성공했습니다. ( 뭐 환영인사나 축하한다는 말은 없는 듯 합니다 ^^)

그런데 사용법을 모릅니다 ㄷㄷㄷ.

그래서 또 다시 구글을 뒤지기 시작했구요.

 

의외로 사용법이 쉬웠습니다. (참고로 저는 NCBI의 데이터베이스를 사용하려는게 아니구, 갖고 있는 레퍼런스 개늠(?)이 존재하기 때문에 아래와 같은 명령어를 썼습니다.)

…/ncbi-blast-2.7.1+-src/c++/ReleaseMT/bin/blastn -query WhatIwant.fasta -subject ReferenceGaeNom.fasta -out test_20180627.txt

  •  빌드를 하고 나면 ReleaseMT/bin/ 아래에 실행파일들이 생기네요. 이 파일들을 시스템에 등록을 해도 되지만… 안그랬습니다.

blanstn -h 로 옵션을 확인해 보니 -help 로 하라고 나오네요.

blastn -help 를 해보니 저는 -subject 옵션을 써야 하더군요.

아주 쉽게 원하는 데이터를 뽑아내었습니다. 이제 이 데이터를 가공해서 유전자 분석 자동화를 만들수 있겠네요.

참고한 사이트입니다.

이 외에도 많았는데, 크롬 창이 갑자기 닫혀 버려서 날라갔습니다. 다음에 참고 될 때 또 올리도록 하겠습니다.

 

댓글 남기기

This site uses Akismet to reduce spam. Learn how your comment data is processed.