2022년 12월 8일 목요일

[makeblastdb] 자신만의 BLAST database 만들기

웹에서 제공하는 BLAST가 아닌 자신의 PC에 BLAST를 설치해서 사용하려고 하면 database도 있어야한다. ncbi ftp에 올라와있는 preformatted DB를 다운로드 받아서 사용하면 웹에서 하는 것과 동일한 결과를 얻을 수 있다.


NCBI FTP https://ftp.ncbi.nlm.nih.gov/

BLAST DB FTP https://ftp.ncbi.nlm.nih.gov/blast/db/

BLAST DB에 대한 설명 https://ftp.ncbi.nlm.nih.gov/blast/db/README


하지만 내가 원하는 시퀀스만을 대상으로 BLAST를 하고 싶다면 직접 BLAST database를 만들어 사용할 수도 있다


Materials

    - Standalone BLAST (이미 설치되어 있어야 한다)

    - database를 구성한 시퀀스 파일 (FASTA 형식으로 amino acid 또는 nucleotide 서열)

Methods

makeblastdb -in [파일이름] -dbtype [amino acid면 prot nucleotide면 nucl] -out [DB이름]

이 후 amino acid 서열로 DB를 만들었다면 BLASTP를, nucleotide 서열이라면 BLASTN를 사용하면 된다.

blastn (또는 blastp) -db [database 이름] <- 이 부분에 자신이 만든 db이름을 넣으면 된다.

2022년 12월 5일 월요일

Local BLAST database download

CRISPR spacer sequence를 분석 중이다. spacer sequence가 viral genome 또는 plasmid, 다른 세균의 CRISPR에 일치하는 하는 경우가 있는지 알아보고 싶다. 웹기반으로 분석하려니 양도 많고 번거롭다. 그래서 nr database를 다운로드 받아서 command-line 기반으로 분석하려고 한다

BLAST는 이미 설치되어 있고 nr database만 다운로드 받으려고 한다

$update_blastdb --decompress nt
$update_blastdb --passive nr *

Unable to close datastream at /usr/bin/update_blastdb line 202.
Failed to download nt.00.tar.gz.md5!
이런 메시지가 뜨고 멈추는데 왜 그러는지 아직 모르겠다.

(wget -b)
(md5sum)