AT4G35800.1
Subcellular Consensus
(Prediction and Experimental) min: :max .
SUBAcon:nucleus 1.000 ASURE: nucleus What is SUBAcon? |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Experimental Localisations and PPI |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
SUBAcon links
AGI-AGI relationships |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Description (TAIR10) | protein_coding : RNA polymerase II large subunit | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Curator Summary (TAIR10) |
Encodes the unique largest subunit of nuclear DNA-dependent RNA polymerase II; the ortholog of budding yeast RPB1 and a homolog of the E. coli RNA polymerase beta prime subunit. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Computational Description (TAIR10) |
RNA polymerase II large subunit (NRPB1); FUNCTIONS IN: DNA-directed RNA polymerase activity, DNA binding; INVOLVED IN: transcription, transcription from RNA polymerase II promoter; LOCATED IN: nucleus, chloroplast, DNA-directed RNA polymerase II, core complex, vacuole; EXPRESSED IN: 26 plant structures; EXPRESSED DURING: 15 growth stages; CONTAINS InterPro DOMAIN/s: RNA polymerase, N-terminal (InterPro:IPR006592), RNA polymerase, alpha subunit (InterPro:IPR000722), RNA polymerase II, heptapeptide repeat, eukaryotic (InterPro:IPR000684), RNA polymerase Rpb1, domain 7 (InterPro:IPR007073), RNA polymerase Rpb1, domain 3 (InterPro:IPR007066), RNA polymerase Rpb1, domain 1 (InterPro:IPR007080), RNA polymerase Rpb1, domain 4 (InterPro:IPR007083), RNA polymerase Rpb1, domain 5 (InterPro:IPR007081), RNA polymerase Rpb1, domain 6 (InterPro:IPR007075); BEST Arabidopsis thaliana protein match is: nuclear RNA polymerase C1 (TAIR:AT5G60040.1); Has 181834 Blast hits to 82224 proteins in 9254 species: Archae - 731; Bacteria - 33255; Metazoa - 56600; Fungi - 34284; Plants - 19037; Viruses - 3576; Other Eukaryotes - 34351 (source: NCBI BLink). | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Protein Annotations |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Coordinates (TAIR10) | chr4:-:16961115..16967892 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Molecular Weight (calculated) | 204637.00 Da | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
IEP (calculated) | 5.87 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GRAVY (calculated) | -0.52 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Length | 1839 amino acids | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sequence (TAIR10) (BLAST) |
0001: MDTRFPFSPA EVSKVRVVQF GILSPDEIRQ MSVIHVEHSE TTEKGKPKVG GLSDTRLGTI DRKVKCETCM ANMAECPGHF GYLELAKPMY HVGFMKTVLS 0101: IMRCVCFNCS KILADEEEHK FKQAMKIKNP KNRLKKILDA CKNKTKCDGG DDIDDVQSHS TDEPVKKSRG GCGAQQPKLT IEGMKMIAEY KIQRKKNDEP 0201: DQLPEPAERK QTLGADRVLS VLKRISDADC QLLGFNPKFA RPDWMILEVL PIPPPPVRPS VMMDATSRSE DDLTHQLAMI IRHNENLKRQ EKNGAPAHII 0301: SEFTQLLQFH IATYFDNELP GQPRATQKSG RPIKSICSRL KAKEGRIRGN LMGKRVDFSA RTVITPDPTI NIDELGVPWS IALNLTYPET VTPYNIERLK 0401: ELVDYGPHPP PGKTGAKYII RDDGQRLDLR YLKKSSDQHL ELGYKVERHL QDGDFVLFNR QPSLHKMSIM GHRIRIMPYS TFRLNLSVTS PYNADFDGDE 0501: MNMHVPQSFE TRAEVLELMM VPKCIVSPQA NRPVMGIVQD TLLGCRKITK RDTFIEKDVF MNTLMWWEDF DGKVPAPAIL KPRPLWTGKQ VFNLIIPKQI 0601: NLLRYSAWHA DTETGFITPG DTQVRIERGE LLAGTLCKKT LGTSNGSLVH VIWEEVGPDA ARKFLGHTQW LVNYWLLQNG FTIGIGDTIA DSSTMEKINE 0701: TISNAKTAVK DLIRQFQGKE LDPEPGRTMR DTFENRVNQV LNKARDDAGS SAQKSLAETN NLKAMVTAGS KGSFINISQM TACVGQQNVE GKRIPFGFDG 0801: RTLPHFTKDD YGPESRGFVE NSYLRGLTPQ EFFFHAMGGR EGLIDTAVKT SETGYIQRRL VKAMEDIMVK YDGTVRNSLG DVIQFLYGED GMDAVWIESQ 0901: KLDSLKMKKS EFDRTFKYEI DDENWNPTYL SDEHLEDLKG IRELRDVFDA EYSKLETDRF QLGTEIATNG DSTWPLPVNI KRHIWNAQKT FKIDLRKISD 1001: MHPVEIVDAV DKLQERLLVV PGDDALSVEA QKNATLFFNI LLRSTLASKR VLEEYKLSRE AFEWVIGEIE SRFLQSLVAP GEMIGCVAAQ SIGEPATQMT 1101: LNTFHYAGVS AKNVTLGVPR LREIINVAKR IKTPSLSVYL TPEASKSKEG AKTVQCALEY TTLRSVTQAT EVWYDPDPMS TIIEEDFEFV RSYYEMPDED 1201: VSPDKISPWL LRIELNREMM VDKKLSMADI AEKINLEFDD DLTCIFNDDN AQKLILRIRI MNDEGPKGEL QDESAEDDVF LKKIESNMLT EMALRGIPDI 1301: NKVFIKQVRK SRFDEEGGFK TSEEWMLDTE GVNLLAVMCH EDVDPKRTTS NHLIEIIEVL GIEAVRRALL DELRVVISFD GSYVNYRHLA ILCDTMTYRG 1401: HLMAITRHGI NRNDTGPLMR CSFEETVDIL LDAAAYAETD CLRGVTENIM LGQLAPIGTG DCELYLNDEM LKNAIELQLP SYMDGLEFGM TPARSPVSGT 1501: PYHEGMMSPN YLLSPNMRLS PMSDAQFSPY VGGMAFSPSS SPGYSPSSPG YSPTSPGYSP TSPGYSPTSP GYSPTSPTYS PSSPGYSPTS PAYSPTSPSY 1601: SPTSPSYSPT SPSYSPTSPS YSPTSPSYSP TSPSYSPTSP AYSPTSPAYS PTSPAYSPTS PSYSPTSPSY SPTSPSYSPT SPSYSPTSPS YSPTSPAYSP 1701: TSPGYSPTSP SYSPTSPSYG PTSPSYNPQS AKYSPSIAYS PSNARLSPAS PYSPTSPNYS PTSPSYSPTS PSYSPSSPTY SPSSPYSSGA SPDYSPSAGY 1801: SPTLPGYSPS STGQYTPHEG DKKDKTGKKD ASKDDKGNP |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
See Also |
|
Citation
If you find this resource useful please cite one of the following publications:
Hooper CM, Castleden I, Tanz SK, Aryamanesh, and Millar, AH (2017) SUBA4: the interactive data analysis centre for Arabidopsis subcellular protein locations Nucleic Acids Res. Jan 4;45(D1):D1064-D1074. doi: 10.1093/nar/gkw1041 (PubMed)
Hooper CM, Tanz SK, Castleden IR, Vacher MA, Small ID, Millar AH (2014) "SUBAcon: a consensus algorithm for unifying the subcellular localization data of the Arabidopsis proteome. Bioinformatics." 1;30(23):3356-64. (Bioinformatics) (PubMed)