<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.5.1">Jekyll</generator><link href="https://progenegen.hmsp.center/feed.xml" rel="self" type="application/atom+xml" /><link href="https://progenegen.hmsp.center/" rel="alternate" type="text/html" /><updated>2021-11-04T15:55:17+00:00</updated><id>https://progenegen.hmsp.center/</id><title type="html">PROGENEGEN</title><subtitle>PRO-GENE-GEN</subtitle><author><name>Yang Zhang</name><email>yang.zhang@cispa.saarland</email></author><entry><title type="html">Press Release: Virtual Cohorts for Medical Research</title><link href="https://progenegen.hmsp.center/news/virtualcohorts/" rel="alternate" type="text/html" title="Press Release: Virtual Cohorts for Medical Research" /><published>2020-07-09T00:00:00+00:00</published><updated>2020-07-09T00:00:00+00:00</updated><id>https://progenegen.hmsp.center/news/virtualcohorts</id><content type="html" xml:base="https://progenegen.hmsp.center/news/virtualcohorts/">&lt;h1 class=&quot;mt-2 mt-md-5&quot;&gt;Artificial intelligence for the benefit of data protection&lt;/h1&gt;
&lt;p&gt;&lt;b&gt;Bonn/Saarbrücken (Germany), July 8, 2020 – Researchers at the DZNE and 
the Helmholtz Center for Information Security (CISPA) intend to use “artificial
intelligence” to facilitate the transfer of genomic data for research purposes 
under the strict constraints of data protection. Their aim is to generate data 
on “virtual cohorts” that contain key information from real study subjects but 
do not allow conclusions to be drawn on individuals. The project named 
“PRO-GENE-GEN” has a total volume of about 360,000 euros. It is funded by DZNE,
CISPA and the Helmholtz Association over the next three years.&lt;/b&gt;&lt;/p&gt;

&lt;p&gt;The human genome is a veritable treasure trove for therapeutic research. It 
is here that mutations can be found that promote or even directly trigger 
certain diseases. In addition to genomic data in the strict sense, 
the “transcriptome” is also relevant as it contains information about which 
parts of the genome are actually active - a pattern that can change due to 
disease. However, scientific studies involving the participation of individuals 
are extremely complex. There is therefore great demand for making data from such
studies generally accessible: for example, to ensure the verification of
research results or to make the data available to research projects that 
only emerged afterwards. “Today’s medical research is data-driven. So-called 
big data is considered to be a key to the development of personalized therapies 
that are better tailored to each individual than conventional treatments,” 
explains Dr. Matthias Becker, a bioinformatician at the DZNE’s Bonn site.&lt;/p&gt;

&lt;h1 class=&quot;mt-4 mt-md-5&quot;&gt;Privacy protection&lt;/h1&gt;
&lt;p&gt;However, the sharing of study data is so far only possible to a limited 
extent, said Becker: “Handling is subject to strict legal regulations, because 
the data is person-related. Although there are mechanisms to protect privacy, 
these are either burdensome or cannot be implemented in practice. In particular 
genomic data can therefore not be shared to an extent necessary to ensure 
scientific progress.”&lt;/p&gt;

&lt;p&gt;The team of DZNE and CISPA scientists therefore aims to develop methods to 
improve the dissemination of such information. “On the basis of real genome data, 
we want to create synthetic data sets that contain key information from the 
original data while fully safeguarding privacy. In a sense, it is a matter of a 
creating a data protection-compliant replica. This is somewhat similar to a 
witness testimony, where the voice is altered to protect identity,” said Becker. 
“This allows large data sets to be made publicly accessible, which is enormously 
important for progress in medicine.”&lt;/p&gt;

&lt;h1 class=&quot;mt-4 mt-md-5&quot;&gt;Learning algorithms&lt;/h1&gt;
&lt;p&gt;The researchers start by addressing specific topics. “For example, it might 
be about the pattern of gene expression. In other words, about the question of 
which genes are active in a certain disease,” said Prof. Mario Fritz, a CISPA 
scientist who is coordinating the research project jointly with Becker. “We want 
to train learning-based algorithms to recognize such patterns in genomic data.
This is a challenge because already the data contained in a single genome is 
extremely complex. And the algorithms use data from hundreds or even thousands 
of people. This is where the strengths of machine learning come in.”&lt;/p&gt;

&lt;p&gt;Furthermore, by means of an approach called “privacy-compliant generative 
modelling”, the researchers intend to develop computer models that reproduce 
the quintessence of such data patterns while at the same time hiding personal 
identity. “One can perhaps think of it as a smart filtering device,” said Fritz.
This way, real data should be converted into synthetic data. “If we start with 
the data from a thousand people, we end up with a similarly large number of 
synthetic data sets. This is what we call a virtual cohort. Its data can be 
analyzed in the same way as real data with common tools of genetic research, 
but without compromising the privacy of the real individuals.”&lt;/p&gt;

&lt;p&gt;Loss of information during the conversion from real to synthetic data cannot 
be excluded. The team of DZNE and CISPA plans to investigate and quantify how 
significant these losses are. “It's not a question of a complete copy,” 
said Becker. “However, ideally, the synthetic data should not only be tailored 
to a specific question, but should be as generally usable as possible. 
For example, for research on dementia, research on cancer or generally for 
research into widespread diseases in which genetics is important. Ultimately, 
the aim is to create options for data exchange that can be used on a broad scale 
within the scientific community.”&lt;/p&gt;

&lt;p&gt;&lt;b&gt;The PRO-GENE-GEN project&lt;/b&gt; was developed within the framework of the 
“Helmholtz Medical Security, Privacy, and AI Research Center” (HMSP). The HMSP
(Web: &lt;a href=&quot;https://hmsp.center&quot;&gt;hmsp.center&lt;/a&gt;) is an association 
of six Helmholtz Centers - 
including CISPA and DZNE - that address key challenges in the field of health 
research with focus on security, privacy, and artificial intelligence. Web: 
&lt;a href=&quot;progenegen.hmsp.center&quot;&gt;progenegen.hmsp.center&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;b&gt;On the German Center for Neurodegenerative Diseases (DZNE)&lt;/b&gt;&lt;/p&gt;

&lt;p&gt;The DZNE investigates all aspects of neurodegenerative diseases 
(such as Alzheimer’s, Parkinson’s and Amyotrophic lateral sclerosis) 
in order to develop novel approaches of prevention, treatment, and health care. 
The DZNE is comprised of ten sites across Germany and cooperates closely with 
universities, university hospitals, and other institutions on a national and 
international level. The DZNE is a member of the Helmholtz Association. Web: 
&lt;a href=&quot;www.dzne.de/en&quot;&gt;www.dzne.de/en&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;b&gt;On the CISPA Helmholtz Center for Information Security&lt;/b&gt;&lt;/p&gt;

&lt;p&gt;CISPA – located in Saarbrücken – is one of the world’s leading research 
institutions in information security and privacy, with a dedicated focus on 
addressing the grand research challenges in security and privacy in a 
comprehensive and holistic manner. Medical security and privacy, as well as 
foundational research in AI/machine learning have been topics of central 
importance for CISPA ever since its inauguration. Web: &lt;a href=&quot;cispa.de&quot;&gt;cispa.de&lt;/a&gt;&lt;/p&gt;</content><author><name>Yang Zhang</name><email>yang.zhang@cispa.saarland</email></author><summary type="html"></summary></entry><entry><title type="html">Press Release: Virtuelle Kohorten für die Medizinforschung</title><link href="https://progenegen.hmsp.center/news/virtuellekohorten/" rel="alternate" type="text/html" title="Press Release: Virtuelle Kohorten für die Medizinforschung" /><published>2020-07-08T00:00:00+00:00</published><updated>2020-07-08T00:00:00+00:00</updated><id>https://progenegen.hmsp.center/news/virtuellekohorten</id><content type="html" xml:base="https://progenegen.hmsp.center/news/virtuellekohorten/">&lt;h1 class=&quot;mt-2 mt-md-5&quot;&gt;Künstliche Intelligenz im Dienst des Datenschutzes&lt;/h1&gt;

&lt;p&gt;&lt;b&gt;Bonn/Saarbrücken, 8. Juli 2020 – Forschende des DZNE und des 
Helmholtz-Zentrums für Informationssicherheit (CISPA) wollen mit Hilfe 
„künstlicher Intelligenz“ die Weitergabe von Genomdaten für Forschungszwecke 
unter den strengen Auflagen des Datenschutzes erleichtern. Ziel ist die 
Generierung „virtueller Kohortendaten“, die zentrale Informationen realer 
Probanden enthalten, jedoch keine Rückschlüsse auf den Einzelnen zulassen. 
Das Projekt mit dem Namen „PRO-GENE-GEN“ hat ein Gesamtvolumen von rund 360.000 
Euro. Es wird in den nächsten drei Jahren von DZNE, CISPA und der 
Helmholtz-Gemeinschaft finanziert. &lt;/b&gt;&lt;/p&gt;

&lt;p&gt;Für die Therapieforschung ist das menschliche Erbgut ein wahrer Fundus. 
Denn hier können Mutationen angelegt sein, die bestimmte Erkrankungen 
begünstigen oder gar direkt auslösen. Neben den Genomdaten im strengen Sinne 
ist auch das „Transkriptom“ von Interesse, da es Informationen darüber enthält,
welche Abschnitte des Erbguts tatsächlich aktiv sind – ein Muster, das sich 
krankheitsbedingt verändern kann. Wissenschaftliche Studien mit 
Personenbeteiligung sind allerdings enorm aufwändig. Deshalb besteht großes 
Interesse daran, die Daten solcher Untersuchungen allgemein zugänglich zu 
machen: etwa um die Nachprüfbarkeit von Forschungsergebnissen zu gewährleisten 
oder auch um sie Forschungsprojekten bereitzustellen, die sich erst im 
Nachhinein ergeben haben. „Die Medizinforschung ist heutzutage datengetrieben. 
Sogenanntes Big Data gilt als ein Schlüssel für die Entwicklung personalisierter 
Therapien, die besser als herkömmliche Behandlungen passgenau auf jeden 
Einzelnen zugeschnitten sind“, erläutert Dr. Matthias Becker, Bioinformatiker 
am DZNE-Standort Bonn.&lt;/p&gt;

&lt;h1 class=&quot;mt-4 mt-md-5&quot;&gt;Schutz der Privatsphäre&lt;/h1&gt;

&lt;p&gt;Eine Weitergabe von Studiendaten sei bislang jedoch nur eingeschränkt 
möglich, so Becker: „Der Umgang unterliegt strengen gesetzlichen Regelungen, 
denn die Daten sind personenbezogen. Es gibt zwar Mechanismen zur Wahrung der 
Privatsphäre, doch diese sind entweder mit erheblichem Aufwand verbunden oder 
in der Praxis nicht umsetzbar. Speziell Genomdaten können deshalb nicht im 
notwendigen Maße geteilt werden, um den wissenschaftlichen Fortschritt zu 
sichern.“&lt;/p&gt;

&lt;p&gt;Das Forschungsteam von DZNE und CISPA will deshalb Methoden entwickeln, 
die eine bessere Verbreitung solcher Informationen ermöglichen. „Auf der 
Grundlage echter Genomdaten möchten wir synthetische Datensätze erstellen, 
die Schlüsselinformationen der ursprünglichen Daten beinhalten und gleichzeitig
die Privatsphäre vollumfänglich absichern. Es geht gewissermaßen um ein 
datenschutzkonformes Abbild. Ähnlich einer Zeugenaussage, bei der die Stimme 
verfremdet wird, um die Identität zu schützen“, sagt Becker. „Dadurch lassen 
sich große Datensätze öffentlich zugänglich machen, was für Fortschritte in 
der Medizin enorm wichtig ist.“&lt;/p&gt;

&lt;h1 class=&quot;mt-4 mt-md-5&quot;&gt;Lernfähige Algorithmen&lt;/h1&gt;
&lt;p&gt;Die Forscher setzen zunächst bei bestimmten Fragestellungen an. 
„Es kann zum Beispiel um das Muster der Genexpression gehen. Also darum, 
welche Gene bei einer bestimmten Erkrankung aktiv sind“, so Prof. Mario Fritz, 
Wissenschaftler am CISPA, der das Forschungsvorhaben gemeinsam mit Becker 
koordiniert. „Wir möchten lernfähige Algorithmen darauf trainieren, solche 
Muster in Genomdaten zu erkennen. Das ist eine Herausforderung, denn schon 
die Daten eines einzelnen Genoms sind äußerst komplex. Und man trainiert die 
Algorithmen anhand der Daten von Hunderten oder gar Tausenden von Personen. 
Hierin liegen die Stärken des maschinellen Lernens.“&lt;/p&gt;

&lt;p&gt;Mit Hilfe einer Methode, die sich „privatsphärenkonforme, generative 
Modellierung“ nennt, wollen die Forschenden zudem Computermodelle entwickeln, 
welche die Quintessenz solcher Datenmuster nachbilden und zugleich den 
Personenbezug ausblenden. „Man kann sich das vielleicht wie einen intelligenten 
Filter vorstellen“, so Fritz. Auf diese Weise sollen reale Daten in synthetische
überführt werden. „Gehen wir etwa von den Daten von 1000 Personen aus, dann 
stehen am Ende eine ähnlich große Anzahl synthetischer Datensätze. Das nennen 
wir virtuelle Kohorte. Deren Daten können genauso wie reale Daten mit gängigen 
Werkzeugen der Genforschung analysiert werden ohne jedoch die Privatsphäre der 
realen Personen zu verletzen.“&lt;/p&gt;

&lt;p&gt;Informationsverluste sind bei der Umwandlung von realen in synthetische 
Daten nicht auszuschließen. Wie bedeutsam diese sind, will das Team von DZNE 
und CISPA untersuchen und quantifizieren. „Es geht ja gerade nicht um eine 
vollständige Kopie“, sagt Becker. „Idealerweise sind die synthetischen Daten 
nicht nur auf eine Fragestellung zugeschnitten, sondern möglichst allgemein 
verwendbar. Etwa für die Demenzforschung, Krebsforschung oder allgemein zur 
Erforschung von Volkskrankheiten, bei denen die Genetik von Bedeutung ist. 
Letztlich geht es darum, Möglichkeiten des Datenaustauschs zu schaffen, die 
innerhalb der Wissenschaft breitflächig genutzt werden können.“&lt;/p&gt;

&lt;p&gt;&lt;b&gt;Das Projekt „PRO-GENE-GEN“&lt;/b&gt; ist im Rahmen des „Helmholtz Medical Security, 
Privacy, and AI Research Centers“ (HMSP) entstanden. Das HMSP 
(Web: &lt;a href=&quot;https://hmsp.center&quot;&gt;hmsp.center&lt;/a&gt;)
ist ein Zusammenschluss von sechs Helmholtz-Zentren – einschließlich CISPA 
und DZNE - die entscheidende Herausforderungen im Bereich der 
Gesundheitsforschung mit Hinblick auf Sicherheit, Privatsphäre und Künstliche 
Intelligenz angehen. Web: 
&lt;a href=&quot;https://progenegen.hmsp.center/&quot;&gt;progenegen.hmsp.center/&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;b&gt;Über das Deutsche Zentrum für Neurodegenerative Erkrankungen e.V. (DZNE)&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;Das DZNE erforscht sämtliche Aspekte neurodegenerativer Erkrankungen 
(wie beispielsweise Alzheimer, Parkinson und ALS), um neue Ansätze der 
Prävention, Therapie und Patientenversorgung zu entwickeln. Durch seine zehn 
Standorte bündelt es bundesweite Expertise innerhalb einer Forschungsorganisation. 
Das DZNE kooperiert eng mit Universitäten, Universitätskliniken und anderen 
Institutionen auf nationaler und internationaler Ebene. Das DZNE ist Mitglied 
der Helmholtz-Gemeinschaft.&lt;/p&gt;

&lt;p&gt;&lt;b&gt;Über das CISPA Helmholtz Zentrum für Informationssicherheit&lt;/b&gt;&lt;/p&gt;

&lt;p&gt;Das CISPA in Saarbrücken ist eines der weltweit führenden Forschungseinrichtungen 
der Informationssicherheit welches Fragen der Datensicherheit und Privatsphäre 
in all ihren Facetten untersucht, mit denen unsere Gesellschaft im Zeitalter der
Digitalisierung konfrontiert wird. Datensicherheit und Privatsphäre in der
Medizin sowie Grundlagenforschung in der künstlichen Intelligenz und des 
maschinellen Lernens sind Themen von zentraler Bedeutung seit der Gründung des 
Zentrums. Web: &lt;a href=&quot;cispa.saarland&quot;&gt;cispa.saarland&lt;/a&gt;&lt;/p&gt;</content><author><name>Yang Zhang</name><email>yang.zhang@cispa.saarland</email></author><summary type="html"></summary></entry><entry><title type="html">Press Release</title><link href="https://progenegen.hmsp.center/news/pressrelease/" rel="alternate" type="text/html" title="Press Release" /><published>2020-05-07T00:00:00+00:00</published><updated>2020-05-07T00:00:00+00:00</updated><id>https://progenegen.hmsp.center/news/pressrelease</id><content type="html" xml:base="https://progenegen.hmsp.center/news/pressrelease/">&lt;p&gt;Im Projekt PRO-GENE-GEN forschen DZNE und CISPA an der Generierung von 
virtuellen Kohortendaten, die die gleichen Eigenschaften wie reale Patientendaten
haben, aber keine Rückschlüsse auf Individuen zulassen. Dadurch können große 
Datensätze zur Entwicklung neuer diagnostischer Ansätze gemeinsam genutzt 
werden, was für personalisierte Medizin zentral ist.
&lt;/p&gt;

&lt;p&gt;
In PRO-GENE-GEN, DZNE and CISPA develop methods to generate virtual cohorts 
from existing genomics datasets that share the same properties but do not 
expose personally identifiable information. This enables the collaborative 
usage of large data sets for diagnostic approaches which is crucial for systems 
medicine.
&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;a href=&quot;https://progenegen.hmsp.center&quot;&gt;https://progenegen.hmsp.center&lt;/a&gt;&lt;/li&gt;

&lt;/ul&gt;

&lt;h1 class=&quot;mt-4&quot;&gt;Kontakt:&lt;/h1&gt;

&lt;p&gt;
&lt;b&gt;Dr. Matthias Becker&lt;/b&gt;&lt;br /&gt;
Deutsches Zentrum für Neurodegenerative Erkrankungen (DZNE)&lt;br /&gt;
Venusberg-Campus 1, Building 99, 53127 Bonn&lt;br /&gt;
Email: &lt;a href=&quot;Matthias.Becker@dzne.de&quot;&gt;Matthias.Becker@dzne.de&lt;/a&gt;&lt;br /&gt; 
Phone: +49 228 43302 642
&lt;/p&gt;

&lt;p&gt;
&lt;b&gt;Prof. Dr. Mario Fritz&lt;/b&gt;&lt;br /&gt;
&lt;!-- #Scientific Director and CEO&lt;br /&gt; --&gt;
Helmholtz Center for Information Security (CISPA)&lt;br /&gt;
Stuhlsatzenhaus 5, 66123 Saarbrücken&lt;br /&gt;
Email: &lt;a href=&quot;mailto:fritz@cispa.saarland&quot;&gt;fritz@cispa.saarland&lt;/a&gt;&lt;br /&gt;
Phone: +49 681 302 71969
&lt;/p&gt;</content><author><name>Yang Zhang</name><email>yang.zhang@cispa.saarland</email></author><summary type="html"></summary></entry></feed>