HMMER User’s Guide
Biological sequence analysis using profile hidden Markov models
http://hmmer.wustl.edu/
Version 2.2; August 2001
Sean Eddy
Howard Hughes Medical Institute and Dept. of Genetics
Washington University School of Medicine
660 South Euclid Avenue, Box 8232
Saint Louis, Missouri 63110, USA
eddy@genetics.wustl.edu
With contributions by Ewan Birney (birney@sanger.ac.uk )
Copyright (C) 1992-2001, Washington University in St. Louis.
Permission is granted to make and distribute verbatim copies of this manual provided the copyright notice
and this permission notice are retained on all copies.
The HMMER software package is a copyrighted work that may be freely distributed and modified under
the terms of the GNU General Public License as published by the Free Software Foundation; either version
2 of the License, or (at your option) any later version. Some versions of HMMER may have been obtained
under specialized commercial licenses from Washington University; for details, see the files COPYING
and LICENSE that came with your copy of the HMMER software.
This program is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without
even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
See the Appendix for a copy of the full text of the GNU General Public License.
1
Contents
1 Tutorial 6
1.1 The programs in HMMER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Files used in the tutorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Searching a sequence database with a single profile HMM . . . . . . . . . . . . . . . . . . 7
HMM construction with hmmbuild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
HMM calibration with hmmcalibrate . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Sequence database search with hmmsearch . . . . . . . . . . . . . . . . . . . . . . . . . 9
Searching major databases like NR or SWISSPROT . . . . . . . . . . . . . . . . . . . . . . 12
Local alignment searches with hmmsearch . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Searching a query sequence against a profile HMM database . . . . . . . . . . . . . . . . . 13
Creating your own profile HMM database . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Parsing the domain structure of a sequence with hmmpfam . . . . . . . . . . . . . . . . . 13
Downloading the PFAM database . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5 Maintaining multiple alignments with hmmalign . . . . . . . . . . . . . . . . . . . . . . 15
2 Introduction 16
2.1 Profile HMMs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Primary changes from HMMER 1.x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Plan 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
The Plan 7 architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Local alignments in Plan 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
The Plan 7 null model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Wing retraction in Plan 7 dynamic programming . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Sequence file formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5 Command line options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Environment variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7 Other profile HMM implementations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3 Manual pages 24
3.1 HMMER - profile hidden Markov model software . . . . . . . . . . . . . . . . . . . . . . . 24
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Sequence File Formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Environment Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 hmmalign - align sequences to an HMM profile . . . . . . . . . . . . . . . . . . . . . . . 26
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.3 hmmbuild - build a profile HMM from an alignment . . . . . . . . . . . . . . . . . . . . 28
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4 hmmcalibrate - calibrate HMM search statistics . . . . . . . . . . . . . . . . . . . . . 32
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5 hmmconvert - convert between profile HMM file formats . . . . . . . . . . . . . . . . . 34
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 hmmemit - generate sequences from a profile HMM . . . . . . . . . . . . . . . . . . . . . 35
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.7 hmmfetch - retrieve an HMM from an HMM database . . . . . . . . . . . . . . . . . . . 36
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.8 hmmindex - create a binary SSI index for an HMM database . . . . . . . . . . . . . . . . 37
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.9 hmmpfam - search one or more sequences against an HMM database . . . . . . . . . . . . 38
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.10 hmmsearch - search a sequence database with a profile HMM . . . . . . . . . . . . . . . 41
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.11 afetch - retrieve an alignment from an alignment database . . . . . . . . . . . . . . . . . 44
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.12 alistat - show statistics for a multiple alignment file . . . . . . . . . . . . . . . . . . . 45
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.13 seqstat - show statistics and format for a sequence file . . . . . . . . . . . . . . . . . . 47
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.14 sfetch - get a sequence from a flatfile database. . . . . . . . . . . . . . . . . . . . . . . 48
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.15 shuffle - randomize the sequences in a sequence file . . . . . . . . . . . . . . . . . . . . 50
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.16 sreformat - convert sequence file to different format . . . . . . . . . . . . . . . . . . . 52
Synopsis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Expert Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4 File formats 55
4.1 HMMER save files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Header section . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Main model section . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Renormalization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Note to developers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 HMMER null model files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.3 HMMER prior files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 Sequence files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Supported file formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
FASTA unaligned sequence format . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Stockholm, the recommended multiple sequence alignment format . . . . . . . . . . . . . . 64
Syntax of Stockholm markup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Semantics of Stockholm markup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Recognized #=GS annotations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Recognized #=GC annotations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Recognized #=GR annotations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
SELEX alignment format . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
An example SELEX file with annotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.5 Count vector files . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4