[English] 日本語

Yorodumi

- EMDB-19397: Composite map of the C. elegans Intron Lariat Spliceosome primed ... -

+
Open data

-
Basic information

Entry

Database: EMDB / ID: EMD-19397

Title

Composite map of the C. elegans Intron Lariat Spliceosome primed for disassembly (ILS')

Map data

Composite Map

Sample

Complex: Intron lariat spliceosome
- RNA: x 3 types
- Protein or peptide: x 32 types
DNA: x 1 types
Ligand: x 4 types

Keywords

mRNA / splicing / Intorn Lariat spliceosome / ILS / pre-mRNA

Function / homology

Function and homology information

feminization of hermaphroditic germ-line / molting cycle / regulation of primary miRNA processing / SLBP independent Processing of Histone Pre-mRNAs / snRNP Assembly / SLBP Dependent Processing of Replication-Dependent Histone Pre-mRNAs / Transport of Mature mRNA derived from an Intron-Containing Transcript / mRNA Splicing - Minor Pathway / Formation of TC-NER Pre-Incision Complex / Dual incision in TC-NER ...feminization of hermaphroditic germ-line / molting cycle / regulation of primary miRNA processing / SLBP independent Processing of Histone Pre-mRNAs / snRNP Assembly / SLBP Dependent Processing of Replication-Dependent Histone Pre-mRNAs / Transport of Mature mRNA derived from an Intron-Containing Transcript / mRNA Splicing - Minor Pathway / Formation of TC-NER Pre-Incision Complex / Dual incision in TC-NER / Gap-filling DNA repair synthesis and ligation in TC-NER / mRNA Splicing - Major Pathway / Downregulation of SMAD2/3:SMAD4 transcriptional activity / germline cell cycle switching, mitotic to meiotic cell cycle / mRNA 3'-end processing / RNA Polymerase II Transcription Termination / vulval development / nematode larval development / egg-laying behavior / post-spliceosomal complex / spliceosomal complex disassembly / U2-type post-mRNA release spliceosomal complex / apoptotic DNA fragmentation / post-mRNA release spliceosomal complex / generation of catalytic spliceosome for first transesterification step / nuclear mRNA surveillance / nuclease activity / spliceosome conformational change to release U4 (or U4atac) and U1 (or U11) / U12-type spliceosomal complex / embryo development ending in birth or egg hatching / RNA splicing, via transesterification reactions / U2-type catalytic step 1 spliceosome / pre-mRNA binding / pICln-Sm protein complex / snRNP binding / SMN-Sm protein complex / spliceosomal tri-snRNP complex / mRNA cis splicing, via spliceosome / P granule / commitment complex / locomotion / U2-type spliceosomal complex / U2-type catalytic step 2 spliceosome / U2 snRNP / U1 snRNP / U4 snRNP / U2-type prespliceosome / cyclosporin A binding / precatalytic spliceosome / generation of catalytic spliceosome for second transesterification step / mRNA 3'-splice site recognition / uterus development / germ cell development / spliceosomal tri-snRNP complex assembly / Prp19 complex / U5 snRNA binding / U5 snRNP / protein K63-linked ubiquitination / U2 snRNA binding / U6 snRNA binding / pre-mRNA intronic binding / spliceosomal snRNP assembly / U1 snRNA binding / U4/U6 x U5 tri-snRNP complex / catalytic step 2 spliceosome / RNA splicing / RNA polymerase II transcription regulatory region sequence-specific DNA binding / peptidylprolyl isomerase / spliceosomal complex / peptidyl-prolyl cis-trans isomerase activity / helicase activity / mRNA splicing, via spliceosome / RING-type E3 ubiquitin transferase / mRNA processing / metallopeptidase activity / ubiquitin-protein transferase activity / ubiquitin protein ligase activity / protein folding / regulation of gene expression / nucleic acid binding / DNA-binding transcription factor activity, RNA polymerase II-specific / cell differentiation / RNA helicase activity / RNA helicase / DNA repair / GTPase activity / mRNA binding / apoptotic process / regulation of transcription by RNA polymerase II / positive regulation of DNA-templated transcription / GTP binding / ATP hydrolysis activity / DNA binding / RNA binding / zinc ion binding / nucleoplasm / ATP binding / nucleus / cytoplasm / cytosol
Similarity search - Function

Intron Large complex component GCFC2-like / Septin and tuftelin interacting protein / Tuftelin interacting protein, N-terminal domain / Tuftelin interacting protein N terminal / GCF, C-terminal / GC-rich sequence DNA-binding factor-like protein / mRNA splicing factor Cwf18-like / : / TFP11/STIP/Ntr1 / cwf18 pre-mRNA splicing factor ...Intron Large complex component GCFC2-like / Septin and tuftelin interacting protein / Tuftelin interacting protein, N-terminal domain / Tuftelin interacting protein N terminal / GCF, C-terminal / GC-rich sequence DNA-binding factor-like protein / mRNA splicing factor Cwf18-like / : / TFP11/STIP/Ntr1 / cwf18 pre-mRNA splicing factor / Nineteen complex-related protein 2 / Pre-mRNA-splicing factor Isy1 / Pre-mRNA-splicing factor Isy1 superfamily / Isy1-like splicing family / Prp19 WD40 domain / : / : / Intron-binding protein aquarius, beta-barrel / Intron-binding protein aquarius insert domain / Peptidyl-prolyl cis-trans isomerase E / : / RBM22 CCCH zinc finger domain / Peptidyl-prolyl cis-trans isomerase E, RNA recognition motif / Pre-mRNA-splicing factor SPF27 / Breast carcinoma amplified sequence 2 (BCAS2) / CWF11 family / Intron-binding protein aquarius, N-terminal / Intron-binding protein aquarius N-terminal / mRNA splicing factor SYF2 / SYF2 splicing factor / Helix hairpin bin domain superfamily / G-patch domain / G-patch domain profile. / G-patch domain / glycine rich nucleic binding domain / Pre-mRNA-processing factor 17 / Pre-mRNA-splicing factor 19 / Pre-mRNA-processing factor 19 / : / Prp19/Pso4-like / : / Pre-mRNA-splicing factor SYF1 middle HAT repeat / G10 protein signature 2. / Cyclophilin-type peptidyl-prolyl cis-trans isomerase, cyclophilin A-like / BUD31/G10-related, conserved site / U-box domain / G10 protein signature 1. / : / Myb-like domain profile. / : / STL11, N-terminal / : / Pre-mRNA-splicing factor Syf1/CRNKL1 C-terminal HAT repeat / SKI-interacting protein SKIP, SNW domain / SKI-interacting protein, SKIP / SKIP/SNW domain / : / Pre-mRNA-splicing factor Syf1/CNRKL1 N-terminal HAT repeat / Pre-mRNA-splicing factor Cwf15/Cwc15 / Cwf15/Cwc15 cell cycle control protein / DNA2/NAM7 helicase, helicase domain / AAA domain / WD repeat Prp46/PLRG1-like / Pre-mRNA-splicing factor Cwc2/Slt11 / : / G10 protein / Pre-mRNA-splicing factor BUD31 / Pre-mRNA splicing factor component Cdc5p/Cef1, C-terminal / : / : / pre-mRNA splicing factor component / DNA2/NAM7-like helicase / : / Myb-like DNA-binding domain / U2 small nuclear ribonucleoprotein A' / Small nuclear ribonucleoprotein D1 / Brr2, N-terminal helicase PWI domain / : / N-terminal helicase PWI domain / Pre-mRNA-splicing helicase BRR2 plug domain / U-box domain profile. / Winged Helix-turn-helix domain / Sec63 Brl domain / Zinc finger, CCCH-type superfamily / : / Modified RING finger domain / U-box domain / zinc finger / Leucine-rich repeat / 116kDa U5 small nuclear ribonucleoprotein component, N-terminal / 116kDa U5 small nuclear ribonucleoprotein component, C-terminal / Snu114, GTP-binding domain / 116 kDa U5 small nuclear ribonucleoprotein component N-terminus / Pre-mRNA-splicing factor Syf1-like / Sec63 domain / Sec63 Brl domain / Small nuclear ribonucleoprotein Sm D2 / Small nuclear ribonucleoprotein Sm D3 / Small nuclear ribonucleoprotein E / Small nuclear ribonucleoprotein G
Similarity search - Domain/homology

Biological species

Caenorhabditis elegans (invertebrata)

Method

single particle reconstruction / cryo EM / Resolution: 2.9 Å

Authors

Vorlaender MK / Rothe P / Plaschka C

Funding support

European Union, 1 items

Citation

Journal: Nature / Year: 2024
Title: Mechanism for the initiation of spliceosome disassembly.
Authors: Matthias K Vorländer / Patricia Rothe / Justus Kleifeld / Eric D Cormack / Lalitha Veleti / Daria Riabov-Bassat / Laura Fin / Alex W Phillips / Luisa Cochella / Clemens Plaschka /

Abstract: Precursor-mRNA (pre-mRNA) splicing requires the assembly, remodelling and disassembly of the multi-megadalton ribonucleoprotein complex called the spliceosome. Recent studies have shed light on ...

History

Deposition	Jan 11, 2024	-
Header (metadata) release	Aug 7, 2024	-
Map release	Aug 7, 2024	-
Update	Nov 20, 2024	-
Current status	Nov 20, 2024	Processing site: PDBe / Status: Released

-
Structure visualization

Supplemental images	emd_19397.png

-
Downloads & links

-
EMDB archive

Map data	emd_19397.map.gz	8.6 MB		EMDB map data format
Header (meta data)	emd-19397-v30.xml emd-19397.xml	60.8 KB 60.8 KB	Display Display	EMDB header
Images	emd_19397.png	136.7 KB
Filedesc metadata	emd-19397.cif.gz	18.7 KB
Archive directory	http://ftp.pdbj.org/pub/emdb/structures/EMD-19397 ftp://ftp.pdbj.org/pub/emdb/structures/EMD-19397	HTTPS FTP

-
Related structure data

Related structure data	8ro0MC 19398C 19399C 50447C 50449C 50450C 50451C 50452C 50453C 50454C 50455C 50456C 50457C 50458C 50459C 50460C 50461C 50462C 50463C 50464C 50465C 50466C 50467C 50468C 50469C 50471C 50472C 50473C 50474C 50475C 50477C 50478C 50479C 50480C 50481C 50482C 50483C 50484C 50485C 50486C 50487C 50488C 50489C 50490C 8ro1C 8ro2C 9fmdC 50558 C: citing same article (ref.) M: atomic model generated by this map
Similar structure data	Similarity search - Function & homologyF&H Search Similarity search - FunctionF&H Search Similarity search - HomologyF&H Search

-
Links

EMDB pages	EMDB (EBI/PDBe) / EMDataResource
Related items in Molecule of the Month	#245 - May 2020 Spliceosomes similarity (95) #81 - Sep 2006 Elongation Factors similarity (12) #259 - Jul 2021 Designed Proteins and Citizen Science similarity (4) #121 - Jan 2010 70S Ribosomes similarity (12) #163 - Jul 2013 HIV Capsid similarity (8) #143 - Nov 2011 Toll-like Receptors similarity (2) #242 - Feb 2020 Coronavirus Proteases similarity (2) #104 - Aug 2008 Selenocysteine Synthase similarity (5) #248 - Aug 2020 Phytosulfokine Receptor similarity (2) #166 - Oct 2013 Proteasome similarity (5) #157 - Jan 2013 Transfer-Messenger RNA similarity (5) #107 - Nov 2008 Mechanosensitive Channels similarity (1) #105 - Sep 2008 Ribonuclease A similarity (2) #148 - Apr 2012 Ras Protein similarity (1) #196 - Apr 2016 Lead Poisoning similarity (1) #239 - Nov 2019 Phospholipase A2 similarity (1) #68 - Aug 2005 Neurotrophins similarity (1)

EMDB pages

EMDB (EBI/PDBe) /

EMDataResource

Related items in Molecule of the Month

#245 - May 2020
Spliceosomes
similarity (95)
#81 - Sep 2006
Elongation Factors
similarity (12)
#259 - Jul 2021
Designed Proteins and Citizen Science
similarity (4)
#121 - Jan 2010
70S Ribosomes
similarity (12)
#163 - Jul 2013
HIV Capsid
similarity (8)
#143 - Nov 2011
Toll-like Receptors
similarity (2)
#242 - Feb 2020
Coronavirus Proteases
similarity (2)
#104 - Aug 2008
Selenocysteine Synthase
similarity (5)
#248 - Aug 2020
Phytosulfokine Receptor
similarity (2)
#166 - Oct 2013
Proteasome
similarity (5)
#157 - Jan 2013
Transfer-Messenger RNA
similarity (5)
#107 - Nov 2008
Mechanosensitive Channels
similarity (1)
#105 - Sep 2008
Ribonuclease A
similarity (2)
#148 - Apr 2012
Ras Protein
similarity (1)
#196 - Apr 2016
Lead Poisoning
similarity (1)
#239 - Nov 2019
Phospholipase A2
similarity (1)
#68 - Aug 2005
Neurotrophins
similarity (1)

-
Map

File

Download / File: emd_19397.map.gz / Format: CCP4 / Size: 343 MB / Type: IMAGE STORED AS FLOATING POINT NUMBER (4 BYTES)

Annotation

Composite Map

Projections & slices

Image control

Size
Brightness
Contrast
Others	InvertY flip

Axes	Z (Sec.)	Y (Row.)	X (Col.)
	1.3 Å/pix. x 448 pix. = 582.982 Å	1.3 Å/pix. x 448 pix. = 582.982 Å	1.3 Å/pix. x 448 pix. = 582.982 Å
Surface
Projections
Slices (1/3)
Slices (1/2)
Slices (2/3)

Images are generated by Spider.

Voxel size

X=Y=Z: 1.3013 Å

Density

Histogram

Histogram (log scale)

Contour Level	By AUTHOR: 0.5
Minimum - Maximum	0.0 - 8.985284
Average (Standard dev.)	0.00885728 (±0.093956225)

Symmetry

Space group: 1

Details

-
Supplemental data

-
Sample components

+
Entire : Intron lariat spliceosome

Entire	Name: Intron lariat spliceosome
Components	Complex: Intron lariat spliceosome RNA: U2 snRNA RNA: U5 snRNA RNA: U6 snRNA Protein or peptide: Pre-mRNA-splicing factor 8 homolog Protein or peptide: U5 small nuclear ribonucleoprotein 200 kDa helicase Protein or peptide: Tr-type G domain-containing protein Protein or peptide: Protein isy-1 Protein or peptide: WD_REPEATS_REGION domain-containing protein Protein or peptide: Pre-mRNA-splicing factor SYF1 Protein or peptide: TPR_REGION domain-containing protein Protein or peptide: Pre-mRNA-splicing factor SPF27 Protein or peptide: Cell division cycle 5-like protein Protein or peptide: Pre-mRNA-splicing factor syf-2 Protein or peptide: Protein BUD31 homolog Protein or peptide: Pre-mRNA-splicing factor RBM22 Protein or peptide: Spliceosome-associated protein CWC15 homolog Protein or peptide: GCF C-terminal domain-containing protein Protein or peptide: Intron-binding protein aquarius Protein or peptide: Uncharacterized protein T27F2.1 Protein or peptide: Peptidyl-prolyl cis-trans isomerase Protein or peptide: WD_REPEATS_REGION domain-containing protein Protein or peptide: Septin and tuftelin-interacting protein 1 homolog Protein or peptide: WD_REPEATS_REGION domain-containing protein Protein or peptide: Coiled-coil domain-containing protein 12 Protein or peptide: Small nuclear ribonucleoprotein Sm D3 Protein or peptide: Probable small nuclear ribonucleoprotein-associated protein B Protein or peptide: Small nuclear ribonucleoprotein Sm D1 Protein or peptide: Probable small nuclear ribonucleoprotein Sm D2 Protein or peptide: Probable small nuclear ribonucleoprotein E Protein or peptide: Probable small nuclear ribonucleoprotein F Protein or peptide: Probable small nuclear ribonucleoprotein G Protein or peptide: Probable U2 small nuclear ribonucleoprotein A' Protein or peptide: RRM domain-containing protein Protein or peptide: Pre-mRNA-processing factor 19 Protein or peptide: Peptidyl-prolyl cis-trans isomerase E DNA: Intron lariat RNA Ligand: MAGNESIUM ION Ligand: INOSITOL HEXAKISPHOSPHATE Ligand: GUANOSINE-5'-TRIPHOSPHATE Ligand: ZINC ION

Entire

Name: Intron lariat spliceosome

Components

Complex: Intron lariat spliceosome
- RNA: U2 snRNA
- RNA: U5 snRNA
- RNA: U6 snRNA
- Protein or peptide: Pre-mRNA-splicing factor 8 homolog
- Protein or peptide: U5 small nuclear ribonucleoprotein 200 kDa helicase
- Protein or peptide: Tr-type G domain-containing protein
- Protein or peptide: Protein isy-1
- Protein or peptide: WD_REPEATS_REGION domain-containing protein
- Protein or peptide: Pre-mRNA-splicing factor SYF1
- Protein or peptide: TPR_REGION domain-containing protein
- Protein or peptide: Pre-mRNA-splicing factor SPF27
- Protein or peptide: Cell division cycle 5-like protein
- Protein or peptide: Pre-mRNA-splicing factor syf-2
- Protein or peptide: Protein BUD31 homolog
- Protein or peptide: Pre-mRNA-splicing factor RBM22
- Protein or peptide: Spliceosome-associated protein CWC15 homolog
- Protein or peptide: GCF C-terminal domain-containing protein
- Protein or peptide: Intron-binding protein aquarius
- Protein or peptide: Uncharacterized protein T27F2.1
- Protein or peptide: Peptidyl-prolyl cis-trans isomerase
- Protein or peptide: WD_REPEATS_REGION domain-containing protein
- Protein or peptide: Septin and tuftelin-interacting protein 1 homolog
- Protein or peptide: WD_REPEATS_REGION domain-containing protein
- Protein or peptide: Coiled-coil domain-containing protein 12
- Protein or peptide: Small nuclear ribonucleoprotein Sm D3
- Protein or peptide: Probable small nuclear ribonucleoprotein-associated protein B
- Protein or peptide: Small nuclear ribonucleoprotein Sm D1
- Protein or peptide: Probable small nuclear ribonucleoprotein Sm D2
- Protein or peptide: Probable small nuclear ribonucleoprotein E
- Protein or peptide: Probable small nuclear ribonucleoprotein F
- Protein or peptide: Probable small nuclear ribonucleoprotein G
- Protein or peptide: Probable U2 small nuclear ribonucleoprotein A'
- Protein or peptide: RRM domain-containing protein
- Protein or peptide: Pre-mRNA-processing factor 19
- Protein or peptide: Peptidyl-prolyl cis-trans isomerase E
DNA: Intron lariat RNA
Ligand: MAGNESIUM ION
Ligand: INOSITOL HEXAKISPHOSPHATE
Ligand: GUANOSINE-5'-TRIPHOSPHATE
Ligand: ZINC ION

+
Supramolecule #1: Intron lariat spliceosome

Supramolecule	Name: Intron lariat spliceosome / type: complex / ID: 1 / Parent: 0 / Macromolecule list: #1-#35
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)

+
Macromolecule #1: U2 snRNA

Macromolecule	Name: U2 snRNA / type: rna / ID: 1 Details: Full sequence: AUCGCUUCUUCGGCUUAUUAGCUAAGAUCAAAGUGUAGUAUCUGUUCUUAUCGUAUUAAC CUACGGUAUACACUCGAAUGAGUGUAAUAAAGGUUAUAUGAUUUUUGGAACCUAGGGAAG ACUCGGGGCUUGCUCCGACUUCCCAAGGGUCGUCCUGGCGUUGCACUGCUGCCGGGCUCGGCCCAGUCCCC Number of copies: 1
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 56.554492 KDa
Sequence	String: AUCGCUUCUU CGGCUUAUUA GCUAAGAUCA AAGUGUAGUA UCUGUUCUUA UCGUAUUAAC CUACGGUAUA CACUCGAAUG AGUGUAAUA AAGGUUAUAU GAUUUUUGGA ACCUAGGGAA GACUCGGGGC UUGCUCCGAC UUCCCAAGGG (N)(N)(N) (N)(N)(N)(N)(N) ...String: AUCGCUUCUU CGGCUUAUUA GCUAAGAUCA AAGUGUAGUA UCUGUUCUUA UCGUAUUAAC CUACGGUAUA CACUCGAAUG AGUGUAAUA AAGGUUAUAU GAUUUUUGGA ACCUAGGGAA GACUCGGGGC UUGCUCCGAC UUCCCAAGGG (N)(N)(N) (N)(N)(N)(N)(N)(N) (N)(N)(N)(N)(N)(N)(N)(N)(N)(N) (N)(N)(N)(N)(N)(N)(N)(N)(N)(N) (N)(N)(N)(N)(N)(N)(N)(N)U CCCC GENBANK: GENBANK: X51372.1, GENBANK: X51372.1

+
Macromolecule #2: U5 snRNA

Macromolecule	Name: U5 snRNA / type: rna / ID: 2 / Number of copies: 1
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 38.680836 KDa
Sequence	String: AAACUCUGGU UCCUCUGCAU UUAACCGUGA AAAUCUUUCG CCUUUUACUA AAGAUUUCCG UGCAAAGGAG CAUACAUUGA GUAUUAUAU ACAAUUUUUG GAGUCCCCUC GAAAGAGCGG GA GENBANK: GENBANK: Z69659.1

+
Macromolecule #3: U6 snRNA

Macromolecule	Name: U6 snRNA / type: rna / ID: 3 / Number of copies: 1
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 32.483355 KDa
Sequence	String: GUUCUUCCGA GAACAUAUAC UAAAAUUGGA ACAAUACAGA GAAGAUUAGC AUGGCCCCUG CGCAAGGAUG ACACGCAAAU UCGUGAAGC GUUCCAAAUU UU GENBANK: GENBANK: X51387.1

+
Macromolecule #4: Pre-mRNA-splicing factor 8 homolog

Macromolecule	Name: Pre-mRNA-splicing factor 8 homolog / type: protein_or_peptide / ID: 4 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 272.396156 KDa
Sequence	String: MANYGGHPQT EPHAIPDSIL EEKSRKWKQL QGKRYSEKKK FGMSDTQKEE MPPEHVRKVI RDHGDMTSRK YRHDKRVYLG ALKYMPHAV LKLLENMPMP WEQIRDVKVL YHITGAITFV NDIPRVIEPV YMAQWGTMWI MMRREKRDRR HFKRMRFPPF D DEEPPLDY ...String: MANYGGHPQT EPHAIPDSIL EEKSRKWKQL QGKRYSEKKK FGMSDTQKEE MPPEHVRKVI RDHGDMTSRK YRHDKRVYLG ALKYMPHAV LKLLENMPMP WEQIRDVKVL YHITGAITFV NDIPRVIEPV YMAQWGTMWI MMRREKRDRR HFKRMRFPPF D DEEPPLDY ADNILDVEPL EPIQMELDPE EDGAVAEWFY DHKPLATTRF VNGPTYRKWA FSIPQMSTLY RLANQLLTDL VD DNYFYLF DMKSFFTAKA LNVAIPGGPK FEPLVKDLHT DEDWNEFNDI NKVIIRAPIR TEYRIAFPFM YNNLISSLPV QVS WYHTPS VVFIKTEDPD LPAFYYDPLI NPIVLSNLKA TEENLPEGEE EDEWELPEDV RPIFEDVPLY TDNTANGLAL LWAP RPFNL RSGRTRRAVD VPLVKSWYRE HCPAGMPVKV RVSYQKLLKV FVLNALKHRP PKPQKRRYLF RSFKATKFFQ TTTLD WVEA GLQVLRQGYN MLNLLIHRKN LNYLHLDYNF NLKPVKTLTT KERKKSRFGN AFHLCREILR LTKLVVDAHV QYRLNN VDA YQLADGLQYI FAHVGQLTGM YRYKYKLMRQ VRMCKDLKHL IYYRFNTGPV GKGPGCGFWA PGWRVWLFFL RGITPLL ER WLGNLLSRQF EGRHSKGVAK TVTKQRVESH FDLELRAAVM HDILDMMPDG IKQNKARVIL QHLSEAWRCW KANIPWKV P GLPTPVENMI LRYVKAKADW WTNSAHYNRE RVRRGATVDK TVCKKNLGRL TRLYLKSEQE RQHNYLKDGP YISAEEAVA IYTTTVHWLE SRRFSPIPFP PLSYKHDTKL LILALERLKE SYSVKNRLNQ SQREELALIE QAYDNPHEAL SRIKRHMLTQ RAFKEVGIE FMDLYTHLIP VYDIEPLEKV TDAYLDQYLW YEADKRRLFP AWVKPGDTEP PPLLTYKWCQ GLNNLQDVWE T SEGECNVI METKLEKIAE KMDLTLLNRL LRLIVDHNIA DYMTSKNNVL INYKDMNHTN SFGIIRGLQF ASFIVQFYGL VL DLLVLGL RRASEIAGPP QCPNEFLQFQ DVATEIGHPI RLYCRYIDRV WIMFRFSADE ARDLIQRYLT EHPDPNNENI VGY NNKKCW PRDARMRLMK HDVNLGRAVF WDIKNRLPRS ITTVEWENSF VSVYSKDNPN MLFDMSGFEC RILPKCRTAN EEFV HRDGV WNLQNEVTKE RTAQCFLKVD EESLSKFHNR IRQILMSSGS TTFTKIVNKW NTALIGLMTY FREAVVNTQE LLDLL VKCE NKIQTRIKIG LNSKMPSRFP PVVFYTPKEI GGLGMLSMGH VLIPQSDLRW MQQTEAGGVT HFRSGMSHDE DQLIPN LYR YIQPWEAEFV DSVRVWAEYA LKRQEANAQN RRLTLEDLDD SWDRGIPRIN TLFQKDRHTL AYDKGWRVRT EFKAYQI LK QNPFWWTHQR HDGKLWNLNN YRTDMIQALG GVEGILEHTL FRGTYFPTWE GLFWERASGF EESMKFKKLT NAQRSGLN Q IPNRRFTLWW SPTINRANVY VGFQVQLDLT GIFMHGKIPT LKISLIQIFR AHLWQKIHES VVMDLCQVFD QELDALEIQ TVQKETIHPR KSYKMNSSCA DVLLFAQYKW NVSRPSLMAD SKDVMDNTTT QKYWLDVQLR WGDYDSHDVE RYARAKFLDY TTDNMSIYP SPTGVLIAID LAYNLYSAYG NWFPGMKPLI RQAMAKIIKA NPAFYVLRER IRKGLQLYSS EPTEPYLTSQ N YGELFSNQ IIWFVDDTNV YRVTIHKTFE GNLTTKPING AIFIFNPRTG QLFLKIIHTS VWAGQKRLSQ LAKWKTAEEV AA LIRSLPV EEQPRQIIVT RKAMLDPLEV HLLDFPNIVI KGSELMLPFQ AIMKVEKFGD LILKATEPQM VLFNLYDDWL KTI SSYTAF SRVVLIMRGM HINPDKTKVI LKPDKTTITE PHHIWPTLSD DDWIKVELAL KDMILADYGK KNNVNVASLT QSEV RDIIL GMEISAPSQQ RQQIADIEKQ TKEQSQVTAT TTRTVNKHGD EIITATTSNY ETASFASRTE WRVRAISSTN LHLRT QHIY VNSDDVKDTG YTYILPKNIL KKFITISDLR TQIAGFMYGV SPPDNPQVKE IRCIVLVPQT GSHQQVNLPT QLPDHE LLR DFEPLGWMHT QPNELPQLSP QDVTTHAKLL TDNISWDGEK TVMITCSFTP GSVSLTAYKL TPSGYEWGKA NTDKGNN PK GYMPTHYEKV QMLLSDRFLG YFMVPSNGVW NYNFQGQRWS PAMKFDVCLS NPKEYYHEDH RPVHFHNFKA FDDPLGTG S ADREDAFA UniProtKB: Pre-mRNA-splicing factor 8 homolog

+
Macromolecule #5: U5 small nuclear ribonucleoprotein 200 kDa helicase

Macromolecule	Name: U5 small nuclear ribonucleoprotein 200 kDa helicase / type: protein_or_peptide / ID: 5 / Number of copies: 1 / Enantiomer: LEVO / EC number: RNA helicase
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 244.151594 KDa
Sequence	String: MADELARIQQ YEYRQNSNLV LSVDYNLTDR RGREEPTGEV LPITDKEMRK MKMGDRAIKG KAPVQDQKKK RKKKDDEKAQ QFGRNVLVD NNELMGAYKP RTQETKQTYE VILSFILDAL GDVPREVLCG AADEVLLTLK NDKFRDKEKK KEVEALLGPL T DDRIAVLI ...String: MADELARIQQ YEYRQNSNLV LSVDYNLTDR RGREEPTGEV LPITDKEMRK MKMGDRAIKG KAPVQDQKKK RKKKDDEKAQ QFGRNVLVD NNELMGAYKP RTQETKQTYE VILSFILDAL GDVPREVLCG AADEVLLTLK NDKFRDKEKK KEVEALLGPL T DDRIAVLI NLSKKISDFS IEEENKPEGD GDIYENEGVN VQFDSDEEED DGGMVNEIKG DSEEESEEEE GVDTDYTATL KG DGHLTED EQKARGILHP RDIDAHWIQR SLAKYFKDPL IAQQKQTEVI GILKNAADDR DAENQLVLLL GFDQFEFIKC LRQ NRLMIL YCTLLRQANE KERLQIEDDM RSRPELHPIL ALLQETDEGS VVQVEKSKRD AEKSKKAATA ANEAISAGQW QAGR KMLDL NDLTFSQGSH LMSNKRCELP DGSYRRQKKS YEEIHVPALK PRPFAEGEKL VSVSELPKWA QPAFDGYKSL NRIQS RLCD SALRSKEHLL LCAPTGAGKT NVALLTMLQE IGNHLAEDGS VKLDEFKIVY IAPMKSLVQE MVGSFSKRLA PFGITV GEM TGDAQMSKEQ FMATQVIVCT PEKYDVVTRK GGERAYNQMV RLLIIDEIHL LHDDRGPVLE SIVVRTIRQM EQNHDEC RL VGLSATLPNY QDVATFLRVK PEHLHFFDNS YRPVPLEQQY IGVTEKKALK RFQAMNEVVY DKIMEHAGKS QVLVFVHS R KETAKTAKAI RDACLEKDTL SAFMREGSAS TEILRTEAEQ AKNLDLKDLL PYGFAIHHAG MNRVDRTLVE DLFADRHIQ VLFSTATLAW GVNLPAHTVI IKGTQIYNPE KGRWTELGAL DIMQMLGRAG RPQYDDRGEG ILITNHSELQ YYLSLMNQQL PVESQMVSR LTDMLNAEVV LGTVSSVSEA TNWLGYTFLF VRMLKNPTLY GITHEQARAD PLLEQRRADL IHTACVLLDK A GLIKYDKR SGIIQATELG RIASHFYCTY ESMQTYNKLL VETCSDIDLF RIFSMSSEFK LLSVRDEEKL ELQKMAEHAP IP IKENLDE ASAKTNVLLQ AYISQLKLEG FALQADMVFV AQSAGRLFRA LFEIVLWRGW AGLAQKVLTL CKMVTQRQWG SLN PLHQFK KIPSEVVRSI DKKNYSFDRL YDLDQHQLGD LIKMPKMGKP LFKFIRQFPK LEMTTLIQPI TRTTMRIELT ITPD FKWDE KVHGSAEGFW IFIEDTDGEK ILHHEFFLLK QKFCSDEHVV KMIVPMFDPM PPLYYVRIVS DRWIGAETVL PISFR HLIL PEKYPPPTEL LDLQPLPISA VTNKEFQTVF AESGFKVFNP IQTQVFRTVF ESNENVIVCA PNGSGKTAIA ELAVLR HFE NTPEAKAVYI TPMEDMATKV YADWKRRLEP AIGHTIVLLT GEQTMDLKLA QRGQLIISTP ERWDNISRRW KQRKSVQ NV KLFIADDLHM IGASNGAVFE VVCSRTRYIS SQLESAVRVV ALSSSLTNAR DLGMWLGCSA SATFNFMPST RPVPLDLE I KSFNLSHNAS RFAAMERPVY QAICRHAGKL EPKPALVFVP VRRQTRPVAV ALLTMALADG APKRFLRLAE HDDTFQALL ADIEDESLRE SVSCGVGFLH EGTAPKDVHI VQQLFESNAI QVCVVPRGMC YQIEMSAYLV VVMDTQFYNG KYHVYEDYPI ADMLHMVGL ANRPILDSDA KCVVMCQTSK RAYYKKFLCD PLPVESHLDH CLHDHFNAEI VTKTIENKQD AIDYLTWTLL Y RRMTQNPN YYNLQGTTHR HLSDALSELV ELTLKDLENS KCIAVKDEMD TVSLNLGMIA SYYYISYQTI ELFSMSLKEK TK TRALIEI ISASSEFGNV PMRHKEDVIL RQLAERLPGQ LKNQKFTDPH VKVNLLIHAH LSRVKLTAEL NKDTELIVLR ACR LVQACV DVLSSNGWLS PAIHAMELSQ MLTQAMYSNE PYLKQLPHCS AALLERAKAK EVTSVFELLE LENDDRSDIL QMEG AELAD VARFCNHYPS IEVATELEND VVTSNDNLML AVSLERDNDI DGLAPPVVAP LFPQKRKEEG WWLVIGDSES NALLT IKRL VINEKSSVQL DFAAPRPGHH KFKLFFISDS YLGADQEFDV AFKVEEPGRS NRKRKHEKEE D UniProtKB: U5 small nuclear ribonucleoprotein 200 kDa helicase

+
Macromolecule #6: Tr-type G domain-containing protein

Macromolecule	Name: Tr-type G domain-containing protein / type: protein_or_peptide / ID: 6 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 110.612859 KDa
Sequence	String: MDSDLYDEFG NYIGPELDSD DDAGDIDDNG DDEDRSDVDE DDEPDRMEED DAEEIPQNQV VLHEDKKYYA TALEVYGEGV ETLVQEEDA QPLTEPIVKP VSKKKFQAAE RFLPETVYKK EYLADLMDCP HIMRNVAIAG HLHHGKTTFL DCLMEQTHPE F YRAEDADA ...String: MDSDLYDEFG NYIGPELDSD DDAGDIDDNG DDEDRSDVDE DDEPDRMEED DAEEIPQNQV VLHEDKKYYA TALEVYGEGV ETLVQEEDA QPLTEPIVKP VSKKKFQAAE RFLPETVYKK EYLADLMDCP HIMRNVAIAG HLHHGKTTFL DCLMEQTHPE F YRAEDADA RFTDILFIEK QRGCSIKSQP VSIVAQDSRS KSYLLNIIDT PGHVNFSDEM TASYRLADGV VVMVDAHEGV MM NTERAIR HAIQERLAVT LCISKIDRLL LELKLPPADA YFKLRLIIDQ VNNILSTFAE EDVPVLSPLN GNVIFSSGRY NVC FSLLSF SNIYAKQHGD SFNSKEFARR LWGDIYFEKK TRKFVKKSPS HDAPRTFVQF ILEPMYKIFS QVVGDVDTCL PDVM AELGI RLSKEEQKMN VRPLIALICK RFFGDFSAFV DLVVQNIKSP LENAKTKIEQ TYLGPADSQL AQEMQKCNAE GPLMV HTTK NYPVDDATQF HVFGRVMSGT LEANTDVRVL GENYSIQDEE DCRRMTVGRL FVRVASYQIE VSRVPAGCWV LIEGID QPI VKTATIAELG YEEDVYIFRP LKFNTRSCVK LAVEPINPSE LPKMLDGLRK VNKSYPLLTT RVEESGEHVL LGTGEFY MD CVMHDMRKVF SEIDIKVADP VVTFNETVIE TSTLKCFAET PNKKNKITMM AEPLEKQLDE DIENEVVQIG WNRRRLGE F FQTKYNWDLL AARSIWAFGP DTTGPNILLD DTLPSEVDKH LLSTVRESLV QGFQWATREG PLCEEPIRQV KFKLLDAAI ATEPLYRGGG QMIPTARRCA YSAFLMATPR LMEPYYTVEV VAPADCVAAV YTVLAKRRGH VTTDAPMPGS PMYTISAYIP VMDSFGFET DLRIHTQGQA FCMSAFHHWQ LVPGDPLDKS IVIKTLDVQP TPHLAREFMI KTRRRKGLSE DVSVNKFFDD P MLLELAKQ QDYTGF UniProtKB: Tr-type G domain-containing protein

+
Macromolecule #7: Protein isy-1

Macromolecule	Name: Protein isy-1 / type: protein_or_peptide / ID: 7 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 31.326172 KDa
Sequence	String: MARNAEKAMT ALARWRRMKE EEERGPIARR PHDVKDCRNL SDAERFRREI VRDASKKITA IQNPGLGEFK LRDLNDEVNR LIKLKHAWE QRIRELGGTD YRKYAQKELD AIGRETGNSR GYKYFGAAKD LPGVRELFEK STEGEEQRRH RADLLRNIDA H YFGYLDDE ...String: MARNAEKAMT ALARWRRMKE EEERGPIARR PHDVKDCRNL SDAERFRREI VRDASKKITA IQNPGLGEFK LRDLNDEVNR LIKLKHAWE QRIRELGGTD YRKYAQKELD AIGRETGNSR GYKYFGAAKD LPGVRELFEK STEGEEQRRH RADLLRNIDA H YFGYLDDE DGRLIPLEKL IEEKNIERIN KEFAEKQAQK QQTASDAAPE NIYKVEEDDD DDLETQESTV IGEDGRPMTI RH VLLPTQQ DIEEMLLEQK KQELMAKYLD UniProtKB: Protein isy-1

+
Macromolecule #8: WD_REPEATS_REGION domain-containing protein

Macromolecule	Name: WD_REPEATS_REGION domain-containing protein / type: protein_or_peptide / ID: 8 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 36.865559 KDa
Sequence	String: MALVTSSGQQ LVSSGFPQQT AQRFSNLMAP TMVLLGHEGE IYTGAFSPDG TCLATSGYDQ KIFFWNVYGE CENFSTIKGH SGAVMDLKF TTDSSSLVSC GTDKSVRVWD METGTCARRF RTHTDFVNAV HPSRRGVTLV ASASDDGTCR VHDMRTKEPV K TYTNRYQQ ...String: MALVTSSGQQ LVSSGFPQQT AQRFSNLMAP TMVLLGHEGE IYTGAFSPDG TCLATSGYDQ KIFFWNVYGE CENFSTIKGH SGAVMDLKF TTDSSSLVSC GTDKSVRVWD METGTCARRF RTHTDFVNAV HPSRRGVTLV ASASDDGTCR VHDMRTKEPV K TYTNRYQQ TAVTFNDSSD QVISGGIDNV LKVWDMRRDE ITYTLTGHRD TITGISLSPS GKFIISNSMD CTVRQWDIRP FV PGQRSVG VFAGHNHNFE KNLLKCSWSP CERFITAGSS DRFLYVWETL SKKIVYKLPG HMGSVNCTDF HPKEPIMLSC GSD KRVFLG EIDMS UniProtKB: U5 small nuclear ribonucleoprotein 40 kDa protein

+
Macromolecule #9: Pre-mRNA-splicing factor SYF1

Macromolecule	Name: Pre-mRNA-splicing factor SYF1 / type: protein_or_peptide / ID: 9 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 99.675094 KDa
Sequence	String: MADKENATKI EKMPNSETMK GISSEDVPFE EDIIRNPTSV NCWQRYIDHK LQNKSPAKQM FLIYERALAV FERSYKLWYH YLKYRESTI VNKCPTDNSW RALCDTYERC LMRLHKMPRI WICYCEVMIK RGLITETRRV FDRALRSLPV TQHMRIWTLY I GFLTSHDL ...String: MADKENATKI EKMPNSETMK GISSEDVPFE EDIIRNPTSV NCWQRYIDHK LQNKSPAKQM FLIYERALAV FERSYKLWYH YLKYRESTI VNKCPTDNSW RALCDTYERC LMRLHKMPRI WICYCEVMIK RGLITETRRV FDRALRSLPV TQHMRIWTLY I GFLTSHDL PETTIRVYRR YLKMNPKARE DYVEYLIERD QIDEAAKELT TLVNQDQNVS EKGRTAHQLW TQLCDLISKN PV KIFSLNV DAIIRQGIYR YTDQVGFLWC SLADYYIRSA EFERARDVYE EAIAKVSTVR DFAQVYDAYA AFEEREVSIM MQE VEQSGD PEEEVDLEWM FQRYQHLMER KNELMNSVLL RQNPHNVGEW LNRVNIYEGN YNKQIETFKE AVKSVNPKIQ VGKV RDLWI GLAKLYEDNG DLDAARKTFE TAVISQFGGV SELANVWCAY AEMEMKHKRA KAALTVMQRA CVVPKPGDYE NMQSV QARV HRSPILWAMY ADYEECCGTV ESCRKVYDKM IELRVASPQM IMNYAMFLEE NEYFELAFQA YEKGIALFKW PGVFDI WNT YLVKFIKRYG GKKLERARDL FEQCLENCPP THAKYIFLLY AKLEEEHGLA RHALSIYNRA CSGVDRADMH SMYNIYI KK VQEMYGIAQC RPIFERAISE LPEDKSRAMS LRYAQLETTV GEIDRARAIY AHAAEISDPK VHVKFWDTWK NFEVAHGN E ATVRDMLRVR RSVEASYNVN VTLTSVQMRV DAERKAQETT TSSNPMDSLD QQQQQPSDGA GSITQVSMNK GNISFVRGA GKTVQQNTTE NPDEIDLDED DDDEEDDGGD ADISVKVVPA QIFGNLKLAE EEEEA UniProtKB: Pre-mRNA-splicing factor SYF1

+
Macromolecule #10: TPR_REGION domain-containing protein

Macromolecule	Name: TPR_REGION domain-containing protein / type: protein_or_peptide / ID: 10 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 88.116 KDa
Sequence	String: MSDDEAAVPG NKPIRLPKKA AKVKNKAPAQ LQITAEQLLR EAKERELELI PPAPKTKITD PDELKEYQRK KRKEFEDGIR KNRMQLANW IKYGKWEESI GEIQRARSVF ERALDVDHRS ISIWLQYAEM EMRCKQINHA RNVFDRAITI MPRAMQFWLK Y SYMEEVIE ...String: MSDDEAAVPG NKPIRLPKKA AKVKNKAPAQ LQITAEQLLR EAKERELELI PPAPKTKITD PDELKEYQRK KRKEFEDGIR KNRMQLANW IKYGKWEESI GEIQRARSVF ERALDVDHRS ISIWLQYAEM EMRCKQINHA RNVFDRAITI MPRAMQFWLK Y SYMEEVIE NIPGARQIFE RWIEWEPPEQ AWQTYINFEL RYKEIDRARS VYQRFLHVHG INVQNWIKYA KFEERNGYIG NA RAAYEKA MEYFGEEDIN ETVLVAFALF EERQKEHERA RGIFKYGLDN LPSNRTEEIF KHYTQHEKKF GERVGIEDVI ISK RKTQYE KMVEENGYNY DAWFDYLRLL ENEETDREEV EDVYERAIAN IPPHSEKRYW RRYIYLWINY ALYEELVAKD FDRA RQVYK ACIDIIPHKT FTFAKVWIMF AHFEIRQLDL NAARKIMGVA IGKCPKDKLF RAYIDLELQL REFDRCRKLY EKFLE SSPE SSQTWIKFAE LETLLGDTDR SRAVFTIAVQ QPALDMPELL WKAYIDFEIA CEEHEKARDL YETLLQRTNH IKVWIS MAE FEQTIGNFEG ARKAFERANQ SLENAEKEER LMLLEAWKEC ETKSGDQEAL KRVETMMPRR VKKRRQIQTE DGVDAGW EE YFDYIFPQDQ AAKGSFKLLE AAARWKRERE EAAARAAQEL DAPIPEGDDD EEKEEAGKDA EEKVREGDSD TDLSESSS S SDSESSSSSS SDSSDSSDDD EDK UniProtKB: Pre-mRNA-splicing factor Syf1/CRNKL1-like C-terminal HAT-repeats domain-containing protein

+
Macromolecule #11: Pre-mRNA-splicing factor SPF27

Macromolecule	Name: Pre-mRNA-splicing factor SPF27 / type: protein_or_peptide / ID: 11 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 27.679885 KDa
Sequence	String: MSSKPLALTG GSGSSQLQDD QVLVDALPYL DTEYNEADRQ LAMKLVEHEC KTFRPTKNYL THLPVPDYDA FLTKCMLKEM DRMKKKEEM GKLDMSRCEL PAPSAVKGVD RKLWAKVLRN AKAQNEHLLM RQINLELMDE YAAESYLQRN KVMEDLLTHA E KELRKTKE ...String: MSSKPLALTG GSGSSQLQDD QVLVDALPYL DTEYNEADRQ LAMKLVEHEC KTFRPTKNYL THLPVPDYDA FLTKCMLKEM DRMKKKEEM GKLDMSRCEL PAPSAVKGVD RKLWAKVLRN AKAQNEHLLM RQINLELMDE YAAESYLQRN KVMEDLLTHA E KELRKTKE AVMEVHANRK MAQLKAGEKV KQLEQSWVSM VTNNYRMEME NRQIDSDNRK QIKALKLDPT KLDDKEDQEN UniProtKB: Pre-mRNA-splicing factor SPF27

+
Macromolecule #12: Cell division cycle 5-like protein

Macromolecule	Name: Cell division cycle 5-like protein / type: protein_or_peptide / ID: 12 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 85.843469 KDa
Sequence	String: MVRVIIKGGV WKNTEDEILK AAIMKYGKNQ WSRIASLLHR KSAKQCKARW FEWLDPGIKK TEWSREEDEK LLHLAKLMPT QWRTIAPIV GRTSAQCLER YEHLLDEAQR KAEGLDEEAT ETRKLKPGEI DPTPETKPAR PDPIDMDDDE LEMLSEARAR L ANTQGKKA ...String: MVRVIIKGGV WKNTEDEILK AAIMKYGKNQ WSRIASLLHR KSAKQCKARW FEWLDPGIKK TEWSREEDEK LLHLAKLMPT QWRTIAPIV GRTSAQCLER YEHLLDEAQR KAEGLDEEAT ETRKLKPGEI DPTPETKPAR PDPIDMDDDE LEMLSEARAR L ANTQGKKA KRKARERQLS DARRLASLQK RREMRAAGLA FARKFKPKRN QIDYSEEIPF EKHVPAGFHN PSEDRYVVED AN QKAIEDH QKPRGREIEM EMRREDREKL KKRKEQGEAD AVFNIKEKKR SKLVLPEPQI SDRELEQIVK IGHASDSVRQ YID GTATSG LLTDYTESAR ANAVAARTMR TPMLKDTVQL ELENLMALQN TESALKGGLN TPLHESELGK GVLPTPKVAA TPNT VLHAI AATPGTQSQF PGSTPGGFAT PAGSVAATPF RDQMRINEEI AGSALEQKAS LKRALASLPT PKNDFEVVGP DDDEV EGAV EDESNQDEDG WIEDASERAE NKAKRNAENR VRNMKMRSQV IQRSLPKPTK VNEQATRATN SSADDMVKAE MSKLLA WDV DNKPPSVIYS REELDAAADL IKQEAESGPE LNSLMWKVVE QCTSEIILSK DKFTRIAILP REEQMKALND EFQMYRG WM NQRAKRAAKV EKKLRVKLGG YQAIHDKLCK KYQEVTTEIE MANIEKKTFE RLGEHELKAI NKRVGRLQQE VTTQETRE K DLQKMYSKLS NKQWKLSQIE IHDAASTTSA PITY UniProtKB: Cell division cycle 5-like protein

+
Macromolecule #13: Pre-mRNA-splicing factor syf-2

Macromolecule	Name: Pre-mRNA-splicing factor syf-2 / type: protein_or_peptide / ID: 13 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 27.719021 KDa
Sequence	String: MSSESQSSSS GPSSSGSKMK DFNQRFRDLH KLRQRARKEN HEQVVEEDRR SKLPKNHEAK KERDQWQVKE LQDRKAAEDK GLDYERVRS LEMSADVTEK LEQKRKRKKN PDQGFTSYED MTLRQHTRLT AALDPDLDSY KKMRECVGGE QFYPTADTLI H GNHYPTTA ...String: MSSESQSSSS GPSSSGSKMK DFNQRFRDLH KLRQRARKEN HEQVVEEDRR SKLPKNHEAK KERDQWQVKE LQDRKAAEDK GLDYERVRS LEMSADVTEK LEQKRKRKKN PDQGFTSYED MTLRQHTRLT AALDPDLDSY KKMRECVGGE QFYPTADTLI H GNHYPTTA AMDKLTKDVH GQVKRREQYH RRRLYDPDAP IDYINEKNKK FNKKLDKYYG KYTEDIKDDL ERGTAI UniProtKB: Pre-mRNA-splicing factor syf-2

+
Macromolecule #14: Protein BUD31 homolog

Macromolecule	Name: Protein BUD31 homolog / type: protein_or_peptide / ID: 14 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 17.153879 KDa
Sequence	String: MSLATKLRRV RKSPPEGWDL IEPTLEQFEA KMREAETEPH EGKRKTEINW PIFRIHHQRS RYVYDMYYKK AEISRELYEF CLTAKFADA ALIAKWKKQG YENLCCVKCV NTRDSNFGTA CICRVPKSKL DAERVIECVH CGCHGCSG UniProtKB: Protein BUD31 homolog

+
Macromolecule #15: Pre-mRNA-splicing factor RBM22

Macromolecule	Name: Pre-mRNA-splicing factor RBM22 / type: protein_or_peptide / ID: 15 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 45.90275 KDa
Sequence	String: MSMSKSSYSQ YNRKNWEDSD FPILCETCLG NNPYMRMMKD KYGRECKICE RPFTTFRWQP GKGARYKNTE LCQTCAKVKN VCQTCMFDL EYGLPVQVRD HELQIADNIP KQGANRDFFL QNVERTLGQG DGTQPIAQIA NNMDQAAHDR LRRMGRTQPY Y KRNAPHIC ...String: MSMSKSSYSQ YNRKNWEDSD FPILCETCLG NNPYMRMMKD KYGRECKICE RPFTTFRWQP GKGARYKNTE LCQTCAKVKN VCQTCMFDL EYGLPVQVRD HELQIADNIP KQGANRDFFL QNVERTLGQG DGTQPIAQIA NNMDQAAHDR LRRMGRTQPY Y KRNAPHIC SFFVKGECKR GEECPYRHEK PTDPDDPLSR QNIRDRYYGT NDPVAEKILN RAAAAPTLSP PADTTITTLY IG NLGPSGA QQVTEKDLND FFYQYGDIRC LRVLTEKGCA FIEFTTREAA ERAAERSFNK TFIKGKRLTI RWGEPQAKRA ADN SNYVTP VPSVPILPVP DGLAPSTSSQ QRFTGSMPRP PAPPTFAAPR SLVVPNVRPV KAGESSGASS SSSIYYPSQD PTRL GAKGD VIE UniProtKB: Pre-mRNA-splicing factor RBM22

+
Macromolecule #16: Spliceosome-associated protein CWC15 homolog

Macromolecule	Name: Spliceosome-associated protein CWC15 homolog / type: protein_or_peptide / ID: 16 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 26.154846 KDa
Sequence	String: MTTAHRPTFH PARGGTARGE GDLSKLSNQY SSKDMPSHTK MKYRQTGQET EADLRKKDLR RELEDKERNA IREKRARDSA SSSSSHSKR QRMDQIAAES AASVDADEAV DELNSSDDDD SDEDDTAALM AELEKIKKER AEEKAARDEE IKEKEEKQRM E NILAGNPL ...String: MTTAHRPTFH PARGGTARGE GDLSKLSNQY SSKDMPSHTK MKYRQTGQET EADLRKKDLR RELEDKERNA IREKRARDSA SSSSSHSKR QRMDQIAAES AASVDADEAV DELNSSDDDD SDEDDTAALM AELEKIKKER AEEKAARDEE IKEKEEKQRM E NILAGNPL LNDTPAGSST SGGDFTVKRR WDDDVVFKNC AKGVEERKKE VTFINDAIRS EFHKKFMDKY IK UniProtKB: Spliceosome-associated protein CWC15 homolog

+
Macromolecule #17: GCF C-terminal domain-containing protein

Macromolecule	Name: GCF C-terminal domain-containing protein / type: protein_or_peptide / ID: 17 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 94.244891 KDa
Sequence	String: MFRKPKAKGA IRQRKSDGWD EPDAENQQVV SAIEVKQPAV PRPAMSFDAD EGADSTFKLK KDKKKVEELK RQHKLEEEAE KLYKEEKIR KEALDKIVKK EKLSKEDKKT KNERHKYLDK YRDKSAKHIS NSESYEYEEN LDIDAEAISS VSNKFNSAFE G IPDSRAVF ...String: MFRKPKAKGA IRQRKSDGWD EPDAENQQVV SAIEVKQPAV PRPAMSFDAD EGADSTFKLK KDKKKVEELK RQHKLEEEAE KLYKEEKIR KEALDKIVKK EKLSKEDKKT KNERHKYLDK YRDKSAKHIS NSESYEYEEN LDIDAEAISS VSNKFNSAFE G IPDSRAVF EAKKRRERAR REGNQDGYIP LDDTQKLKSK SERNRLIRED ENDDSDEECT NKFYSARELL RTEEDRRREE QE GFLEREN GDIDEAERIK GDDDSENEEW EKQQIRKAVS RREIGQLRTE KRNTSKLFGH TVPVEDDTAM DMDIDLDMDV QVI GKPEFT GPSNTGGVVK IEDILAKLKL RIQERDEALN FRKEEKRKLE QNIEENKSMI AKIEMELPNQ STKYTMYQEL RVYS RSLLE CLNEKVGEIN SIIDKKRDCG KSRTSRLSVR RRQDMRDQHA ECMQGRNARM GEAAGRAAER DARRGRRRRE REFTL ARIN HEEGLSTDDE EPTPQSMNDQ KICDEVEAVA SVLFADALDE YSDLRKVFGR MTDWLAVDPK SFQDAYVYLC IPKLSS PYV RLQILRADFL RKETILTSMQ WFHIAMLAGS ENAEIDQSHE ILVELAPAIV EKVVIPFLID TVKEEWDPMS LRQTRHL TT FCSLFEKLPN LTEKSKQFNA FLNAIRERIC DCISEDLFMP IFMPNALEQP ICRQFHDRQF WTCIKLIKSI NALSPLIS I AARFELVVEK CVNSQCVMAL RTGSKNDVTA ERKVRGLLAE LDDSLLKMGG RTSFRQLIGT LELIAEEQSK AGRSFHKEI RKFLEKLER UniProtKB: GCF C-terminal domain-containing protein

+
Macromolecule #18: Intron-binding protein aquarius

Macromolecule	Name: Intron-binding protein aquarius / type: protein_or_peptide / ID: 18 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 170.397688 KDa
Sequence	String: MVTKRHQEAV VTRGAIENDT ISAVAAKFWA PFTAETHENF DAKLIDTIYD NEMLKTSFNS RKIMMLEFSQ YLEAYLWPNY VPEKASKAW NMSIVVMINE KFRERNLDSW NCFTKKSEHF PHFFKSILQL SLQEEGLASS EHCALLTFLV NAFGSVETPI V HKETRKLV ...String: MVTKRHQEAV VTRGAIENDT ISAVAAKFWA PFTAETHENF DAKLIDTIYD NEMLKTSFNS RKIMMLEFSQ YLEAYLWPNY VPEKASKAW NMSIVVMINE KFRERNLDSW NCFTKKSEHF PHFFKSILQL SLQEEGLASS EHCALLTFLV NAFGSVETPI V HKETRKLV SIEIWAGLLD SQREDLFKKQ KKLKKIWENV RQKMTAAAAD NNEFERTYLW NLIEKFKRVL NSLEPNEAQE SE EGEVRDP IDSIKYCERF IELLIDLESI LQTRRFFNSV LHSSHILTHC LLSSLISTDA GSLFFQLVQL LKFYARFEID DLS GRQLTH KEVSEQHYQS VTRLQKAAFR LFNETMKEFY VLNVSGVDTR RALQKQFGDM NHAEVYRFAE YLHLVPAFGE DPNH QTSLL HLYPHQHLVE TITLHCERRP NQLTQLNEKP LFPTEKVIWD ENIIPYENYT GDGVLALDKL NLQFLTLHDY LLRNF NLFQ LESTYEIRQD LEDVLFRMKP FQHESRNETV FSGWARMALQ IDHFQISEVA KPLVGEKSPA VVRGVVTVNI GRRQDI RQE WENLRKHDVC FLVACRSRKS ASGLKFDVRR PFSEQIEVLS VRGCDVEGML DQDGHLLEEF TAWEKKAKIP GDLRKFR LL LDPNQYRIDM EQGTKDDIYD TFNLIVRRDS KTNNFKAVLQ TIRDLLNTEC VVPDWLTDVI LGYGEPDSAH YSKLSSAV P ELDFNDTFLS FAHVKESFPG YKIELADGFD EKEAVPPFKL EFKELERRQD VEIKPGELRT ILVTPLTRKK VTPYSYDPR KNQVKFTPSQ VEAIKSGMQP GLTMVVGPPG TGKTDVAVQI ISNIYHNWPN QRTLIVTHSN QALNQLFEKI IALDVDERHL LRMGHGEEA LETEKDFSRY GRVNYVLKER LQLLNCVEKL AKALKIVGDV AYTCENAGYF FRFSVCRVWE EFLAKVTSKG C NKLAEGII SEIFPFTGFF KDIPDLFSGN NSADLKVAHS CWRHIEQIFE KLDEFRAFEL LRNGRDRTEY LLVKEAKIIA MT CTHAALR RNELVKLGFR YDNIVMEEAA QILEVETFIP LLLQNPQDGH NRLKRWIMIG DHHQLPPVVQ NQAFQKYSNM EQS LFARLV RLSVPNVQLD RQGRARAQIA ELYQWRYNGL GNLPHVDGLP QFQNANAGFA FPFQFIDIPD FNGHGETQPS PHFY QNLGE AEYACALYTY MRILGYPAEK ISILTTYNGQ AQLIRDVFQR RCDTNPLIGM PAKVSTVDKY QGQQNDFIIL SLVKT RNIG HIRDVRRLVV ALSRARLGLY VLGRSKVFMD CLELTPAMRI FAKYPRKLVI LPFEAHPTIR KWNERSKDGE PMEIQD TLH MTHFVHEFYM SNLPAMRDAY EQAMNEYMES QRLLNPPIDE TQMDVETEHE KKHREAMERK KKQEMDDKKE ADIHFED MD HEMQEPAATA APAPGAPAVE EPPPK UniProtKB: Intron-binding protein aquarius

+
Macromolecule #19: Uncharacterized protein T27F2.1

Macromolecule	Name: Uncharacterized protein T27F2.1 / type: protein_or_peptide / ID: 19 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 60.303516 KDa
Sequence	String: MSMKLRDILP APVAADEAAS QIRRDPWFGG RDNEPSAALV SKEPPPYGKR TSFRPRGPED FGDGGAFPEI HVAQFPLGLG LGDMRGKPE NTLALQYGTD GKLQHDAIAR IGHVKDKVVY SKLNDMKAKT WNEDDDDIQK PDDDAVIDAT EKTRMALEKI V NSKVASAL ...String: MSMKLRDILP APVAADEAAS QIRRDPWFGG RDNEPSAALV SKEPPPYGKR TSFRPRGPED FGDGGAFPEI HVAQFPLGLG LGDMRGKPE NTLALQYGTD GKLQHDAIAR IGHVKDKVVY SKLNDMKAKT WNEDDDDIQK PDDDAVIDAT EKTRMALEKI V NSKVASAL PVRHADKLAP AQYIRYTPSQ QNGAAGSQQR IIRMVEEQKD PMEPPKFKIN QKIPRAPPSP PAPVMHSPPR KM TAKDQND WKIPPCISNW KNPKGFTVGL DKRLAADGRG LQQTHINENF AKLADALYIA DRKAREEVET RAQLERRVAQ NKK SEQEAK MAEAAAKARQ ERSAMRRKDD EDDEQVKVRE EIRRDRLDDI RKERNIARSR PDKADKLRKE RERDISEKIV LGLP DTNQK RTGEPQFDQR LFDKTQGLDS GAMDDDTYNP YDAAWRGGDS VQQHVYRPSK NLDNDVYGGD LDKIIEQKNR FVADK GFSG AEGSSRGSGP VQFEKDQDVF GLSSLFEHTK EKKRGGDGGD SRGESKRSRR D UniProtKB: Uncharacterized protein T27F2.1

+
Macromolecule #20: Peptidyl-prolyl cis-trans isomerase

Macromolecule	Name: Peptidyl-prolyl cis-trans isomerase / type: protein_or_peptide / ID: 20 / Number of copies: 1 / Enantiomer: LEVO / EC number: peptidylprolyl isomerase
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 18.547002 KDa
Sequence	String: MPAPINDQAP YVILDTTMGK IALELYWNHA PRTCQNFSQL AKRNYYNGTI FHRIIADFMI QGGDPTGTGR GGASIYGDKF SDEIDERLK HTGAGILSMA NAGPNTNGSQ FFITLAPTQH LDGKHTIFGR VAAGMKVIAN MGRVDTDNHD RPKIEIRILK A YPSESSVL S UniProtKB: Peptidyl-prolyl cis-trans isomerase

+
Macromolecule #21: WD_REPEATS_REGION domain-containing protein

Macromolecule	Name: WD_REPEATS_REGION domain-containing protein / type: protein_or_peptide / ID: 21 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 54.766215 KDa
Sequence	String: MSASVSDPYE QMPAAPTDDD LEDKPEADKK ALLNQVFKSL KRAQDLFYHD YAQPPPMPEE NDSLIRSMKR KHEYGNVIKK VEEMKVRRE NEMLALPTSQ PMHGTGSVIA SAGTPLAITD GSGKLVNQQQ GSAKSGTLLP LVPLGNSSKG EDNTTRSLLP S KAPMMMKP ...String: MSASVSDPYE QMPAAPTDDD LEDKPEADKK ALLNQVFKSL KRAQDLFYHD YAQPPPMPEE NDSLIRSMKR KHEYGNVIKK VEEMKVRRE NEMLALPTSQ PMHGTGSVIA SAGTPLAITD GSGKLVNQQQ GSAKSGTLLP LVPLGNSSKG EDNTTRSLLP S KAPMMMKP KWHAPWKLYR VASGHTGWVR AVDVEPGNQW FASGGADRII KIWDLASGQL KLSLTGHISS VRAVKVSPRH PF LFSGGED KQVKCWDLEY NKVIRHYHGH LSAVQALSVH PSLDVLVTCA RDSTARVWDM RTKAQVHCFA GHTNTVADVV CQS VDPQVI TASHDATVRL WDLAAGRSMC TLTHHKKSVR ALTIHPRLNM FASASPDNIK QWKLPKGEFM QNLSGHNAII NTLS SNDDG VVVSGADNGS LCFWDWRSGF CFQKIQTKPQ PGSIESEAGI YASCFDKTGL RLITAEADKT IKMYKEDDEA TEESH PIVW RPEIVKKKAY UniProtKB: Pleiotropic regulator 1

+
Macromolecule #22: Septin and tuftelin-interacting protein 1 homolog

Macromolecule	Name: Septin and tuftelin-interacting protein 1 homolog / type: protein_or_peptide / ID: 22 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 94.421539 KDa
Sequence	String: MEDDDGRESF EINDMDLEYA MNPGGRRRFQ NKDQATYGVF APDSDDDDDE QGTSRGPYKK RSKISAPMSF VSGGIQQGNK IDKDDPASL NLNLGGEKKP KEDDEGSIQI DFDKRTKKAP KQNGAQVFAG MRSSANHGAA DINQFGSWMR GDGNSNKIMK M MQAMGYKP ...String: MEDDDGRESF EINDMDLEYA MNPGGRRRFQ NKDQATYGVF APDSDDDDDE QGTSRGPYKK RSKISAPMSF VSGGIQQGNK IDKDDPASL NLNLGGEKKP KEDDEGSIQI DFDKRTKKAP KQNGAQVFAG MRSSANHGAA DINQFGSWMR GDGNSNKIMK M MQAMGYKP GEGLGAQGQG IVEPVQAQLR KGRGAVGAYG KESTATGPKF GESAADAQKR MAQEGTSSRP TNDDQEKSGL KI KGSWKKS QTVKTKYRTI EDVMEEGMSA SRPASHQQSQ QYSNIKVIDM TGKQQKIYSG YDSFSMKTRS EYDTVDDEER TVF DVPELI HNLNLLVDLT EEGIRRSNQQ LISLKDQTTA LEYDLQQVQK SLGTEEQEAQ HIKDVYELID GFSSNRSPSM EECQ ELFRR LRSEFPHEYE LYSLETVAIP TVLPLIQKYF VAWKPLEDKN YGCELISTWR DILDDSKNGR KMTFGHNKTK GDEIR AYDR IIWEGILPSI RRACLQWDPS TQMHEMIELV EQWIPLLSAW ITENILEQLV VPKIAERVNQ WDPMTDEIPI HEWLVP WLV LLGDRIQTVM PPIRQKLSKA LKLWDPMDRS ALETLRPWQN VWSAATFSAF IAQNIVPKLG VALDTMELNP TMNPEYP EW TACMEWLEFT HPDAIANIVT KYFFPRFYNC LCLWLDSPGV DYNEVKRWYG SWKARIPQVL VNYPTVNENL RRSMIAIG R SLQGEKVGGL QATPIAPMAP PPPMAPHFTQ AAPVQKLSLK EIIEYTAGKN GFTYHPQKDR YKDGRQVFWF GALSIYLDS EMVYVMDPIE FVWRPSGLNE LIQMAQGAQG UniProtKB: Septin and tuftelin-interacting protein 1 homolog

+
Macromolecule #23: WD_REPEATS_REGION domain-containing protein

Macromolecule	Name: WD_REPEATS_REGION domain-containing protein / type: protein_or_peptide / ID: 23 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 65.385664 KDa
Sequence	String: MDALQAYGGS DSEHSDDDAS MDQVAKGKSS TLLERAIVTA PDVESKSAIR QVAIVDPKTK EIKSNPKFDQ LFKPESGPVN HFKSEQQRS QKNTLTGFVE PAHLNEFHFN RQIRSFDTLG YAQNPTAESG TTHFVGDVKK AEAEKGVSLF ESKKTGGEKR K RVRNDDSA ...String: MDALQAYGGS DSEHSDDDAS MDQVAKGKSS TLLERAIVTA PDVESKSAIR QVAIVDPKTK EIKSNPKFDQ LFKPESGPVN HFKSEQQRS QKNTLTGFVE PAHLNEFHFN RQIRSFDTLG YAQNPTAESG TTHFVGDVKK AEAEKGVSLF ESKKTGGEKR K RVRNDDSA DIDGYTGPWS RFIDEKTVAK PTPELQKQMD EIVKKRQEKS RRFKKEKEDS EQMAEESSTL HLKEAEDYQG RS FLVPPSF TGVNLREDYV PERCFVPKKL VHTYRGHNKG VNFLQWFPKS AHLFLSCSMD TKIKLWEVYD RQRVVRTYAG HKL PVREVA FNNEGTEFLS ASFDRYVKLW DTETGQVKQR FHTGHVPYCL KYHPDDDKNH MFLVGMQNKK IIQWDSRSGE IVQE YDRHL QAVNSITFFD KNRRFASTSD DKSVRIWEWE IPVDTKLIQN VGLHAIPTMT KSPNDKWVVG QCMDNRIVLF QLVDD KLRF SKKKAFRGHN AAGYACNIDF SPDQSFLISG DADGKLFIWD WRTHKIVGKW KAHDSTCIAA LWHPHEKSRM ITAGWD GLI KMWN UniProtKB: Pre-mRNA-processing factor 17

+
Macromolecule #24: Coiled-coil domain-containing protein 12

Macromolecule	Name: Coiled-coil domain-containing protein 12 / type: protein_or_peptide / ID: 24 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 19.138486 KDa
Sequence	String: MTDKNNSDSD EDIESLTNHE TSLEAAAKAR KRRLLAMKSK IHGIEMQEED YDEGETSTKK SREVGREFRN HKPDDAVGTQ NVDMDLDIV QREITEHLKD VLHEKAIDSV DLAMLAPKKI DWDLKRDIES KLQKLERRTQ KAVATIIRQR LAEGKGDLAA T VNAAAAQN L UniProtKB: Coiled-coil domain-containing protein 12

+
Macromolecule #25: Small nuclear ribonucleoprotein Sm D3

Macromolecule	Name: Small nuclear ribonucleoprotein Sm D3 / type: protein_or_peptide / ID: 25 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 14.836212 KDa
Sequence	String: MTSVGVPIKI LHEAEGHMVT LETVTGEVYR GKLSEAEDNM NCQLAETVVT FRDGRSHQLD NVFIRGNKIR FMILPDMLKN APMFKNIGR AQKGAIGMGL GGLDQRGRGR GTAFRRPMGR GGPRGMSRPG GAPTFRG UniProtKB: Small nuclear ribonucleoprotein Sm D3

+
Macromolecule #26: Probable small nuclear ribonucleoprotein-associated protein B

Macromolecule	Name: Probable small nuclear ribonucleoprotein-associated protein B type: protein_or_peptide / ID: 26 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 16.768627 KDa
Sequence	String: MTISKNNKMM AHLNYRMKII LQDGRTFIGF FKAFDKHMNI LLAECEEHRQ IKPKAGKKTD GEEKRILGLV LVRGEHIVSM TVDGPPPRD DDSVRLAKAG GAGGVGQAKP GGRGMPAMPG MPGMPPGGAP GGLSGAMRGH GGPGMAAMQP GYGGPPGGRP F UniProtKB: Probable small nuclear ribonucleoprotein-associated protein B

+
Macromolecule #27: Small nuclear ribonucleoprotein Sm D1

Macromolecule	Name: Small nuclear ribonucleoprotein Sm D1 / type: protein_or_peptide / ID: 27 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 13.72407 KDa
Sequence	String: MKLVRFLMKL SHETVNIELK NGTQVSGTIM GVDVAMNTHL RAVSMTVKNK EPVKLDTLSI RGNNIRYIIL PDPLALDTLL IDDEPRKKA RAARAGASRG RGGRGGMRGG RGGRGRGRGG PRGAGPRR UniProtKB: Small nuclear ribonucleoprotein Sm D1

+
Macromolecule #28: Probable small nuclear ribonucleoprotein Sm D2

Macromolecule	Name: Probable small nuclear ribonucleoprotein Sm D2 / type: protein_or_peptide / ID: 28 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 13.291529 KDa
Sequence	String: MSAQAKPRSE MTAEELAAKE DEEFNVGPLS ILTNSVKNNH QVLINCRNNK KLLGRVKAFD RHCNMVLENV KEMWTEVPKT GKGKKKAKS VAKDRFISKM FLRGDSVILV VKNPLAQAE UniProtKB: Probable small nuclear ribonucleoprotein Sm D2

+
Macromolecule #29: Probable small nuclear ribonucleoprotein E

Macromolecule	Name: Probable small nuclear ribonucleoprotein E / type: protein_or_peptide / ID: 29 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 10.625318 KDa
Sequence	String: MSTRKLNKVM VQPVNLIFRY LQNRTRVQIW LYEDVTHRLE GYIIGFDEFM NVVFDEAEEV NMKTKGRNKI GRILLKGDNI TLIHAAQQE A UniProtKB: Probable small nuclear ribonucleoprotein E

+
Macromolecule #30: Probable small nuclear ribonucleoprotein F

Macromolecule	Name: Probable small nuclear ribonucleoprotein F / type: protein_or_peptide / ID: 30 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 9.256534 KDa
Sequence	String: MSAVQPVNPK PFLNSLTGKF VVCKLKWGME YKGVLVAVDS YMNLQLAHAE EYIDGNSQGN LGEILIRCNN VLYVGGVDGE NETSA UniProtKB: Probable small nuclear ribonucleoprotein F

+
Macromolecule #31: Probable small nuclear ribonucleoprotein G

Macromolecule	Name: Probable small nuclear ribonucleoprotein G / type: protein_or_peptide / ID: 31 / Number of copies: 2 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 8.756209 KDa
Sequence	String: MSKTHPPELK KYMDKEMDLK LNGNRRVSGI LRGFDPFMNM VIDEAVEYQK DGGSVNLGMT VIRGNSVVIM EPKERIS UniProtKB: Probable small nuclear ribonucleoprotein G

+
Macromolecule #32: Probable U2 small nuclear ribonucleoprotein A'

Macromolecule	Name: Probable U2 small nuclear ribonucleoprotein A' / type: protein_or_peptide / ID: 32 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 28.9059 KDa
Sequence	String: MVRLTTELFA ERPQFVNSVN MREINLRGQK IPVIENMGVT RDQFDVIDLT DNDIRKLDNF PTFSRLNTLY LHNNRINYIA PDIATKLPN LKTLALTNNN ICELGDIEPL AECKKLEYVT FIGNPITHKD NYRMYMIYKL PTVRVIDFNR VRLTEREAAK K MFKGKSGK ...String: MVRLTTELFA ERPQFVNSVN MREINLRGQK IPVIENMGVT RDQFDVIDLT DNDIRKLDNF PTFSRLNTLY LHNNRINYIA PDIATKLPN LKTLALTNNN ICELGDIEPL AECKKLEYVT FIGNPITHKD NYRMYMIYKL PTVRVIDFNR VRLTEREAAK K MFKGKSGK KARDAIQKSV HTEDPSEIEP NENSSGGGAR LTDEDREKIK EAIKNAKSLS EVNYLQSILA SGKVPEKGWN RQ MDQNGAD GEAMES UniProtKB: Probable U2 small nuclear ribonucleoprotein A'

+
Macromolecule #33: RRM domain-containing protein

Macromolecule	Name: RRM domain-containing protein / type: protein_or_peptide / ID: 33 / Number of copies: 1 / Enantiomer: LEVO
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 24.881344 KDa
Sequence	String: MADINPNHTI YVNNLNEKVK KDELKRSLHM VFTQFGEIIQ LMSFRKEKMR GQAHIVFKEV SSASNALRAL QGFPFYGKPM RIQYAREDS DVISRAKGTF VEKRQKSTKI AKKPYEKPAK NGKSAAEPTQ KEPQETDGPG LPNNILFCSN IPEGTEPEQI Q TIFSQFPG ...String: MADINPNHTI YVNNLNEKVK KDELKRSLHM VFTQFGEIIQ LMSFRKEKMR GQAHIVFKEV SSASNALRAL QGFPFYGKPM RIQYAREDS DVISRAKGTF VEKRQKSTKI AKKPYEKPAK NGKSAAEPTQ KEPQETDGPG LPNNILFCSN IPEGTEPEQI Q TIFSQFPG LREVRWMPNT KDFAFIEYES EDLSEPARQA LDNFRITPTQ QITVKFASK UniProtKB: RRM domain-containing protein

+
Macromolecule #34: Pre-mRNA-processing factor 19

Macromolecule	Name: Pre-mRNA-processing factor 19 / type: protein_or_peptide / ID: 34 / Number of copies: 4 / Enantiomer: LEVO / EC number: RING-type E3 ubiquitin transferase
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 53.272633 KDa
Sequence	String: MSFVCGISGE LTEDPVVSQV SGHIFDRRLI VKFIAENGTD PISHGELSED QLVSLKSGGT GSAPRNVSGT SIPSLLKMLQ DEWDTVMLN SFSLRQQLQI ARQELSHSLY QHDAACRVIS RLSKELTAAR EALSTLKPHT SAKVDDDVSI DESEDQQGLS E AILAKLEE ...String: MSFVCGISGE LTEDPVVSQV SGHIFDRRLI VKFIAENGTD PISHGELSED QLVSLKSGGT GSAPRNVSGT SIPSLLKMLQ DEWDTVMLN SFSLRQQLQI ARQELSHSLY QHDAACRVIS RLSKELTAAR EALSTLKPHT SAKVDDDVSI DESEDQQGLS E AILAKLEE KSKSLTAERK QRGKNLPEGL AKTEELAELK QTASHTGIHS TGTPGITALD IKGNLSLTGG IDKTVVLYDY EK EQVMQTF KGHNKKINAV VLHPDNITAI SASADSHIRV WSATDSSSKA IIDVHQAPVT DISLNASGDY ILSASDDSYW AFS DIRSGK SLCKVSVEPG SQIAVHSIEF HPDGLIFGTG AADAVVKIWD LKNQTVAAAF PGHTAAVRSI AFSENGYYLA TGSE DGEVK LWDLRKLKNL KTFANEEKQP INSLSFDMTG TFLGIGGQKV QVLHVKSWSE VVSLSDHSGP VTGVRFGENA RSLVT CSLD KSLRVFSF UniProtKB: Pre-mRNA-processing factor 19

+
Macromolecule #35: Peptidyl-prolyl cis-trans isomerase E

Macromolecule	Name: Peptidyl-prolyl cis-trans isomerase E / type: protein_or_peptide / ID: 35 / Number of copies: 1 / Enantiomer: LEVO / EC number: peptidylprolyl isomerase
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 36.469277 KDa
Sequence	String: MNTNFPHNRK RTLYVGGFTE DVTEKVLMAA FIPFGDVVAI SIPMDYESGK HRGFGFVEFD MAEDAAMAID NMNESELFGK TIRVNFARP PKATERSQKP VWADDEWLKK YGRGGEAAAE EDGDAEKAAT SSSSASTKLP RVYLGVKIGI RYIGRIVIEL R TDVTPKTA ...String: MNTNFPHNRK RTLYVGGFTE DVTEKVLMAA FIPFGDVVAI SIPMDYESGK HRGFGFVEFD MAEDAAMAID NMNESELFGK TIRVNFARP PKATERSQKP VWADDEWLKK YGRGGEAAAE EDGDAEKAAT SSSSASTKLP RVYLGVKIGI RYIGRIVIEL R TDVTPKTA ENFRCLCTGE RGFGYEGSIF HRIIPKFMLQ GGDFTKGDGT GGKSIYGTKF DDENFTLRHT MPGTVSMANC GA NTNGSQF FICTEKTDWL DGKHVVFGHV VEGMNIVRQV EQQGTPSGKP QMVVKIVESG EIEPEKRIAA EKLAQKAVVP GAE IQEPLP QAMET UniProtKB: Peptidyl-prolyl cis-trans isomerase E

+
Macromolecule #36: Intron lariat RNA

Macromolecule	Name: Intron lariat RNA / type: dna / ID: 36 / Number of copies: 1 / Classification: DNA
Source (natural)	Organism: Caenorhabditis elegans (invertebrata)
Molecular weight	Theoretical: 3.680845 KDa
Sequence	String: (N)(N)(N)(N)(N)(N)(N)(N)(N)(N) (N)(N)(N)(N)(N)(N)(N)(N)(N)

+
Macromolecule #37: MAGNESIUM ION

+
Macromolecule #38: INOSITOL HEXAKISPHOSPHATE

Macromolecule	Name: INOSITOL HEXAKISPHOSPHATE / type: ligand / ID: 38 / Number of copies: 2 / Formula: IHP
Molecular weight	Theoretical: 660.035 Da
Chemical component information	ChemComp-IHP: INOSITOL HEXAKISPHOSPHATE

+
Macromolecule #39: GUANOSINE-5'-TRIPHOSPHATE

Macromolecule	Name: GUANOSINE-5'-TRIPHOSPHATE / type: ligand / ID: 39 / Number of copies: 1 / Formula: GTP
Molecular weight	Theoretical: 523.18 Da
Chemical component information	ChemComp-GTP: GUANOSINE-5'-TRIPHOSPHATE / GTP, energy-carrying molecule*YM

+
Macromolecule #40: ZINC ION

-
Experimental details

-
Structure determination

Method	cryo EM
Processing	single particle reconstruction
Aggregation state	particle

-
Sample preparation

Buffer	pH: 7.9
Vitrification	Cryogen name: ETHANE
Details	Crosslinked with glutaraledhyde

-
Electron microscopy

Microscope	FEI TITAN KRIOS
Image recording	Film or detector model: GATAN K3 BIOQUANTUM (6k x 4k) / Average electron dose: 60.0 e/Å²
Electron beam	Acceleration voltage: 300 kV / Electron source: FIELD EMISSION GUN
Electron optics	Illumination mode: FLOOD BEAM / Imaging mode: BRIGHT FIELD / Nominal defocus max: 2.0 µm / Nominal defocus min: 0.7000000000000001 µm
Experimental equipment	Model: Titan Krios / Image courtesy: FEI Company

-
Image processing

Startup model	Type of model: PDB ENTRY PDB model - PDB ID: 6id1
Final reconstruction	Resolution.type: BY AUTHOR / Resolution: 2.9 Å / Resolution method: FSC 0.143 CUT-OFF / Number images used: 879523
Initial angle assignment	Type: MAXIMUM LIKELIHOOD
Final angle assignment	Type: MAXIMUM LIKELIHOOD

-
Atomic model buiding 1

Initial model	Chain - Source name: AlphaFold / Chain - Initial model type: in silico model
Refinement	Protocol: AB INITIO MODEL
Output model	PDB-8ro0: Structure of the C. elegans Intron Lariat Spliceosome primed for disassembly (ILS')

+
About Yorodumi

-
News

-
Feb 9, 2022. New format data for meta-information of EMDB entries

New format data for meta-information of EMDB entries

Version 3 of the EMDB header file is now the official format.
The previous official version 1.9 will be removed from the archive.

Related info.:EMDB header

External links:wwPDB to switch to version 3 of the EMDB data model

-
Aug 12, 2020. Covid-19 info

Covid-19 info

URL: https://pdbj.org/emnavi/covid19.php

New page: Covid-19 featured information page in EM Navigator.

Related info.:Covid-19 info / Mar 5, 2020. Novel coronavirus structure data

+
Mar 5, 2020. Novel coronavirus structure data

+
Jan 31, 2019. EMDB accession codes are about to change! (news from PDBe EMDB page)

+
Jul 12, 2017. Major update of PDB

-
Yorodumi

Thousand views of thousand structures

Yorodumi is a browser for structure data from EMDB, PDB, SASBDB, etc.
This page is also the successor to EM Navigator detail page, and also detail information page/front-end page for Omokage search.
The word "yorodu" (or yorozu) is an old Japanese word meaning "ten thousand". "mi" (miru) is to see.

Related info.:EMDB / PDB / SASBDB / Comparison of 3 databanks / Yorodumi Search / Aug 31, 2016. New EM Navigator & Yorodumi / Yorodumi Papers / Jmol/JSmol / Function and homology information / Changes in new EM Navigator and Yorodumi

Macromolecule	Name: MAGNESIUM ION / type: ligand / ID: 37 / Number of copies: 7 / Formula: MG
Molecular weight	Theoretical: 24.305 Da

Macromolecule	Name: ZINC ION / type: ligand / ID: 40 / Number of copies: 6 / Formula: ZN
Molecular weight	Theoretical: 65.409 Da

-Movie

-Structure viewers

+Viewer log

-This page

-This web site

-Options

+Open data

-Basic information

-Structure visualization

-Downloads & links

-EMDB archive

-Related structure data

-Links

-Map

Image controlX

-Supplemental data

-Sample components

+Entire : Intron lariat spliceosome

+Supramolecule #1: Intron lariat spliceosome

+Macromolecule #1: U2 snRNA

+Macromolecule #2: U5 snRNA

+Macromolecule #3: U6 snRNA

+Macromolecule #4: Pre-mRNA-splicing factor 8 homolog

+Macromolecule #5: U5 small nuclear ribonucleoprotein 200 kDa helicase

+Macromolecule #6: Tr-type G domain-containing protein

+Macromolecule #7: Protein isy-1

+Macromolecule #8: WD_REPEATS_REGION domain-containing protein

+Macromolecule #9: Pre-mRNA-splicing factor SYF1

+Macromolecule #10: TPR_REGION domain-containing protein

+Macromolecule #11: Pre-mRNA-splicing factor SPF27

+Macromolecule #12: Cell division cycle 5-like protein

+Macromolecule #13: Pre-mRNA-splicing factor syf-2

+Macromolecule #14: Protein BUD31 homolog

+Macromolecule #15: Pre-mRNA-splicing factor RBM22

+Macromolecule #16: Spliceosome-associated protein CWC15 homolog

+Macromolecule #17: GCF C-terminal domain-containing protein

+Macromolecule #18: Intron-binding protein aquarius

+Macromolecule #19: Uncharacterized protein T27F2.1

+Macromolecule #20: Peptidyl-prolyl cis-trans isomerase

+Macromolecule #21: WD_REPEATS_REGION domain-containing protein

+Macromolecule #22: Septin and tuftelin-interacting protein 1 homolog

+Macromolecule #23: WD_REPEATS_REGION domain-containing protein

+Macromolecule #24: Coiled-coil domain-containing protein 12

+Macromolecule #25: Small nuclear ribonucleoprotein Sm D3

+Macromolecule #26: Probable small nuclear ribonucleoprotein-associated protein B

+Macromolecule #27: Small nuclear ribonucleoprotein Sm D1

+Macromolecule #28: Probable small nuclear ribonucleoprotein Sm D2

+Macromolecule #29: Probable small nuclear ribonucleoprotein E

+Macromolecule #30: Probable small nuclear ribonucleoprotein F

+Macromolecule #31: Probable small nuclear ribonucleoprotein G

+Macromolecule #32: Probable U2 small nuclear ribonucleoprotein A'

+Macromolecule #33: RRM domain-containing protein

+Macromolecule #34: Pre-mRNA-processing factor 19

+Macromolecule #35: Peptidyl-prolyl cis-trans isomerase E

+Macromolecule #36: Intron lariat RNA

+Macromolecule #37: MAGNESIUM ION

+Macromolecule #38: INOSITOL HEXAKISPHOSPHATE

+Macromolecule #39: GUANOSINE-5'-TRIPHOSPHATE

+Macromolecule #40: ZINC ION

-Experimental details

-Structure determination

-Sample preparation

-Electron microscopy

-Image processing

-Atomic model buiding 1

+About Yorodumi

-News

-Feb 9, 2022. New format data for meta-information of EMDB entries

-Aug 12, 2020. Covid-19 info

+Mar 5, 2020. Novel coronavirus structure data

+Jan 31, 2019. EMDB accession codes are about to change! (news from PDBe EMDB page)

+Jul 12, 2017. Major update of PDB

-Yorodumi

-
Movie

-
Structure viewers

+
Viewer log

-
This page

-
This web site

-
Options