AT1G63020.1
Subcellular Consensus
(Prediction and Experimental) min: :max .
SUBAcon:nucleus 1.000 ASURE: nucleus What is SUBAcon? |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Experimental Localisations and PPI |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SUBAcon links
AGI-AGI relationships |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Description (TAIR10) | protein_coding : nuclear RNA polymerase D1A | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Curator Summary (TAIR10) |
Encodes one of two alternative largest subunits of a putative plant-specific RNA polymerase IV (aka RNA polymerase D). Required for posttranscriptional gene silencing. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Computational Description (TAIR10) |
nuclear RNA polymerase D1A (NRPD1A); FUNCTIONS IN: DNA-directed RNA polymerase activity, DNA binding; INVOLVED IN: in 7 processes; LOCATED IN: nucleus, DNA-directed RNA polymerase IV complex; EXPRESSED IN: 9 plant structures; EXPRESSED DURING: 6 growth stages; CONTAINS InterPro DOMAIN/s: RNA polymerase, N-terminal (InterPro:IPR006592), RNA polymerase, alpha subunit (InterPro:IPR000722), RNA polymerase Rpb1, domain 3 (InterPro:IPR007066), RNA polymerase Rpb1, domain 1 (InterPro:IPR007080), RNA polymerase Rpb1, domain 4 (InterPro:IPR007083), Protein of unknown function DUF3223 (InterPro:IPR021602), RNA polymerase Rpb1, domain 5 (InterPro:IPR007081); BEST Arabidopsis thaliana protein match is: nuclear RNA polymerase D1B (TAIR:AT2G40030.1); Has 18758 Blast hits to 17462 proteins in 6889 species: Archae - 580; Bacteria - 5923; Metazoa - 1639; Fungi - 1387; Plants - 5197; Viruses - 287; Other Eukaryotes - 3745 (source: NCBI BLink). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Protein Annotations |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Coordinates (TAIR10) | chr1:-:23355329..23361126 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Molecular Weight (calculated) | 162530.00 Da | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IEP (calculated) | 7.51 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GRAVY (calculated) | -0.27 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Length | 1453 amino acids | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sequence (TAIR10) (BLAST) |
0001: MEDDCEELQV PVGTLTSIGF SISNNNDRDK MSVLEVEAPN QVTDSRLGLP NPDSVCRTCG SKDRKVCEGH FGVINFAYSI INPYFLKEVA ALLNKICPGC 0101: KYIRKKQFQI TEDQPERCRY CTLNTGYPLM KFRVTTKEVF RRSGIVVEVN EESLMKLKKR GVLTLPPDYW SFLPQDSNID ESCLKPTRRI ITHAQVYALL 0201: LGIDQRLIKK DIPMFNSLGL TSFPVTPNGY RVTEIVHQFN GARLIFDERT RIYKKLVGFE GNTLELSSRV MECMQYSRLF SETVSSSKDS ANPYQKKSDT 0301: PKLCGLRFMK DVLLGKRSDH TFRTVVVGDP SLKLNEIGIP ESIAKRLQVS EHLNQCNKER LVTSFVPTLL DNKEMHVRRG DRLVAIQVND LQTGDKIFRS 0401: LMDGDTVLMN RPPSIHQHSL IAMTVRILPT TSVVSLNPIC CLPFRGDFDG DCLHGYVPQS IQAKVELDEL VALDKQLINR QNGRNLLSLG QDSLTAAYLV 0501: NVEKNCYLNR AQMQQLQMYC PFQLPPPAII KASPSSTEPQ WTGMQLFGML FPPGFDYTYP LNNVVVSNGE LLSFSEGSAW LRDGEGNFIE RLLKHDKGKV 0601: LDIIYSAQEM LSQWLLMRGL SVSLADLYLS SDLQSRKNLT EEISYGLREA EQVCNKQQLM VESWRDFLAV NGEDKEEDSV SDLARFCYER QKSATLSELA 0701: VSAFKDAYRD VQALAYRYGD QSNSFLIMSK AGSKGNIGKL VQHSMCIGLQ NSAVSLSFGF PRELTCAAWN DPNSPLRGAK GKDSTTTESY VPYGVIENSF 0801: LTGLNPLESF VHSVTSRDSS FSGNADLPGT LSRRLMFFMR DIYAAYDGTV RNSFGNQLVQ FTYETDGPVE DITGEALGSL SACALSEAAY SALDQPISLL 0901: ETSPLLNLKN VLECGSKKGQ REQTMSLYLS EYLSKKKHGF EYGSLEIKNH LEKLSFSEIV STSMIIFSPS SNTKVPLSPW VCHFHISEKV LKRKQLSAES 1001: VVSSLNEQYK SRNRELKLDI VDLDIQNTNH CSSDDQAMKD DNVCITVTVV EASKHSVLEL DAIRLVLIPF LLDSPVKGDQ GIKKVNILWT DRPKAPKRNG 1101: NHLAGELYLK VTMYGDRGKR NCWTALLETC LPIMDMIDWG RSHPDNIRQC CSVYGIDAGR SIFVANLESA VSDTGKEILR EHLLLVADSL SVTGEFVALN 1201: AKGWSKQRQV ESTPAPFTQA CFSSPSQCFL KAAKEGVRDD LQGSIDALAW GKVPGFGTGD QFEIIISPKV HGFTTPVDVY DLLSSTKTMR RTNSAPKSDK 1301: ATVQPFGLLH SAFLKDIKVL DGKGIPMSLL RTIFTWKNIE LLSQSLKRIL HSYEINELLN ERDEGLVKMV LQLHPNSVEK IGPGVKGIRV AKSKHGDSCC 1401: FEVVRIDGTF EDFSYHKCVL GATKIIAPKK MNFYKSKYLK NGTLESGGFS ENP |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
See Also |
|
Citation
If you find this resource useful please cite one of the following publications:
Hooper CM, Castleden I, Tanz SK, Aryamanesh, and Millar, AH (2017) SUBA4: the interactive data analysis centre for Arabidopsis subcellular protein locations Nucleic Acids Res. Jan 4;45(D1):D1064-D1074. doi: 10.1093/nar/gkw1041 (PubMed)
Hooper CM, Tanz SK, Castleden IR, Vacher MA, Small ID, Millar AH (2014) "SUBAcon: a consensus algorithm for unifying the subcellular localization data of the Arabidopsis proteome. Bioinformatics." 1;30(23):3356-64. (Bioinformatics) (PubMed)