<div dir="ltr"><br><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">---------- Forwarded message ---------<br>From: <b class="gmail_sendername" dir="auto">David Ardell</b> <span dir="auto"><<a href="mailto:dardell@ucmerced.edu">dardell@ucmerced.edu</a>></span><br>Date: Tue, Aug 24, 2021 at 9:03 AM<br>Subject: Fall 2021 Syllabus for QSB 282: Bioinformatics<br>To: qsb-grads <<a href="mailto:qsb-grads@ucmerced.edu">qsb-grads@ucmerced.edu</a>>, qsb-faculty <<a href="mailto:qsb-faculty@ucmerced.edu">qsb-faculty@ucmerced.edu</a>><br></div><br><br>



<div style="word-wrap:break-word;line-break:after-white-space">
<div>
<div id="m_1978099513469208302header">
<h1><font size="4"><span style="font-style:normal;font-weight:normal">Dear QSB Faculty and Students, </span></font></h1>
<div><font size="4">Hello! Please find below the Fall 202 syllabus for QSB 282: Bioinformatics. </font></div>
<div><font size="4"><br>
</font></div>
<div><font size="4">At the end of the syllabus, you will find a curated list of links to books</font><span style="font-size:large"> available </span><span style="font-size:large">freely </span><span style="font-size:large">online
 or</span><span style="font-size:large"> through the library, that I hope you might find useful.</span></div>
<div><span style="font-size:large"><br>
</span></div>
<div><span style="font-size:large">Please consider registering for the course, or having your students register for this course. </span><span style="font-size:large">If you have any questions about it, please contact me. Welcome!</span></div>
<div><font size="4"><br>
</font></div>
<div><font size="4">Thanks, and have a great semester. </font></div>
<div><font size="4"><br>
</font></div>
<div><font size="4">Best wishes,</font></div>
<div><font size="4">Dave Ardell</font></div>
<h1 style="font-size:26px">QSB 282: Bioinformatics</h1>
<h4 style="font-size:14px">David H. Ardell</h4>
<h4 style="font-size:14px">Fall 2021</h4>
</div>
<div id="m_1978099513469208302syllabus-version" style="font-size:14px">
<h1 style="font-size:26px"><span>1</span> Syllabus Version</h1>
<p>This is Version 1.</p>
</div>
<div id="m_1978099513469208302prerequisite" style="font-size:14px">
<h1 style="font-size:26px"><span>2</span> Prerequisite</h1>
<p>Graduate Standing.</p>
</div>
<div id="m_1978099513469208302course-goals-and-objectives" style="font-size:14px">
<h1 style="font-size:26px"><span>3</span> Course Goals and Objectives</h1>
<p>Welcome to Bioinformatics! This course aims to provide transferable life-skills in computer literacy including scripting and programming, statistics, data science and modeling useful for any biology student. In it, we learn elements of
<b>literacy in scientific computing</b> such as theoretical descriptions of code, data and machines, theory and practice of programming, compiling, installing and using free open-source software, libraries, package managers, and network security
 specifically in the professional UNIX-like command-prompt paradigm. The class is now centered on the functional and interpreted language R, as well as the UNIX/Tidyverse “pipes and filters” paradigm. It also touches on the powerful scripting language Perl
 and the object-oriented language Python. The course starts with a <b>
science in society</b> component that explores the <b>ethical and scientific imperatives for the publication of reproducible computational workflows using Free, Open-Source Software (FOSS) as part of open science.</b> After emphasizing
 the disadvantages of commercial closed-source software for all users, especially scientists and engineers, we train in the use of FOSS alternatives including RStudio/RMarkdown, Overleaf, LaTeX, Git and GNU tools. We learn elements of introductory data science,
 statistics and machine learning including methods to analyze, integrate, visualize, model and simulate larger volumes of text, numerical and biological data. We learn fundamental topics in modern statistics including analysis of frequencies and location, experimental
 design, regression and classification, goodness of fit, false discovery rates, and machine learning concepts, emphasizing non-parametric, likelihood-based and Bayesian approaches, with applications to functional genomics, proteomics, phylogeny and other subjects.
 We learn elements of bioinformatics and molecular evolutionary theory as part of learning how to rigorously and reproducibly apply open-source implementations of bioinformatics algorithms to conduct original computational analyses and syntheses of these data.
 After this course you will have an advanced introductory ability to apply the theoretical and practical foundations of bioinformatics and critically evaluate analyses done by others.
<b>At the end of this course, you will be qualified to profess that you can program reproducible bioinformatic workflows and data science projects in Git, Overleaf, LaTeX, R/RStudio/RMarkdown, UNIX and Tidyverse Pipelines, Perl one-liners and
 Regular Expressions, object-oriented programming against bioinformatics APIs in Python, and conversant in bioinformatics theory, software and methods.</b> Graduate Bioinformatics QSB 282 includes
<b>discussions on original bioinformatics and statistics literature readings</b> and an original
<b>final project applying course concepts and methods.</b></p>
</div>
<div id="m_1978099513469208302theoretical-topics" style="font-size:14px">
<h1 style="font-size:26px"><span>4</span> Theoretical Topics</h1>
<p>Theoretical topics covered in QSB 282 encompass</p>
<ul>
<li>Elements of computer science theory including:
<ul>
<li>fundamentals of data, descriptions and machines,</li><li>programming paradigms (declarative, functional, pipelined, compiled vs interpretive, object-oriented),</li><li>regular expressions, formal languages, automata</li></ul>
</li><li>Elements of molecular evolution, bioinformatics and statistics theory including:
<ul>
<li>homology and similarity</li><li>evolutionary distances and models of sequence evolution (p-distance, poisson correction, substitution matrices, DNA evolutionary models),</li><li>bioinformatic scores and likelihoods</li><li>alignment by dynamic programming</li><li>theory and practice of pairwise and multiple sequence alignment, greedy algorithms such as CLUSTALW</li><li>distance-based methods in phylogeny including neighbor-joining and unsupervised machine learning methods</li><li>BLAST theory and practice including p-values and E-values</li><li>profile models of motif and other sequence families</li></ul>
</li><li>Elements of statistics theory including:
<ul>
<li>statistical analysis of frequencies, compositions and location, including parametric, non-parametric and Bayesian approaches</li><li>genome-wide analysis of differential gene expression and proteomics</li><li>elements of experimental design including batch effects</li><li>empirical Bayes moderated statistics</li><li>multiple test corrections including Family Wise Error Rates and False Discovery Rates</li><li>elements of machine learning including classifiers and statistics for their performance including Receiver-Operator-Characteristic (ROC) curves and Area-Under-Curve (AUC)</li></ul>
</li></ul>
</div>
<div id="m_1978099513469208302practical-skills" style="font-size:14px">
<h1 style="font-size:26px"><span>5</span> Practical Skills</h1>
<p>Students are guided interactively with partial solutions to gain experience using RMarkdown/RStudio, Overleaf and Git, the UNIX command-line, UNIX Pipelines, Git, Overleaf, Regular Expressions, elements of data science including data cleaning and
 control, data integration, data visualizations in UNIX and R, package managers, compiling open-source software, regular expressions, perl one-liners and BASH scripting, bioinformatics with open-source software such as CodonW, BLAST, PSI-BLAST, CLUSTALW, PUZZLE,
 BioNJ, HMMer, Parsing with Biopython, analysis of gene expression data in R using Voom, limma and R-based implementations of GSEA.</p>
</div>
<div id="m_1978099513469208302student-learning-outcomes" style="font-size:14px">
<h1 style="font-size:26px"><span>6</span> Student Learning Outcomes</h1>
<p>At the conclusion of QSB 282, we aim to provide students with the ability to:</p>
<ol>
<li><b>use UNIX-like command-line computing environments</b> to manipulate files, SSH/SCP to securely transfer data between servers and computers over the internet, as well as to understand and apply basic concepts about computer
 architecture, networks and security</li><li><b>compile and install free, open-source software (FOSS)</b> and libraries in UNIX and
<b>understand why open-source software and data formats benefit the scientific enterprise</b></li><li><b>creatively manipulate and integrate text, numerical, and biological data</b> using UNIX command-line tools in novel combinations including perl one-liners, python object-oriented APIs, and R.</li><li>acquire biological data from public databases and rigorously and <b>
reproducibly apply open-source implementations of bioinformatics algorithms to conduct original computational analyses and syntheses</b> of these data, including alignment, homology search, phylogeny, and differential gene expression analysis.</li><li>understand the theoretical bases, assumptions, and quantities of different bioinformatics algorithms, concepts, and statistics and apply them in bioinformatic treatment of data and
<b>critically evaluate analyses done by others</b></li><li>critically read and evaluate bioinformatics and statistics primary literature, and
<b>write publication-quality bioinformatics and statistcal methods, results and conclusions</b></li><li>conduct an <b>original directed but independent research project</b> that applies and synthesizes the concepts and techniques of the course.</li></ol>
</div>
<div id="m_1978099513469208302required-materials" style="font-size:14px">
<h1 style="font-size:26px"><span>7</span> Required Materials</h1>
<ol>
<li>A personal computer.<b>Your computer should have at least 10 GB free on its hard drive, be updated with the latest operating system updates, and be backed-up to an external hard-drive in the event of data loss.</b></li><li>Internet access.</li><li><a href="https://it.ucmerced.edu/VPN_Changeover" target="_blank">A VPN Client</a> to access primary and secondary scientific literature available through the library, while off-campus.</li></ol>
</div>
<div id="m_1978099513469208302required-and-supplemental-course-readings" style="font-size:14px">
<h1 style="font-size:26px"><span>8</span> Required and Supplemental Course Readings</h1>
<p>Discussion write-ups and lab assignments will require students to access primary and secondary scientific literature as well as eBooks available either freely on the internet or through the library (see above about installing a VPN client to access
 readings from off-campus).</p>
<p>All students are expected to supplement lecture slides with <b>
independent reading</b> from the excellent <b>O’Reilly Online Learning</b> resource available for free through the library. Suggested titles and specific assigned readings are listed below. The value of this resource for independent
 learning and reference cannot be overemphasized!</p>
<p><b>To access O’Reilly Online Learning readings, sign in through its special portal at
<a href="https://www.oreilly.com/library/view/temporary-access/" target="_blank">https://www.oreilly.com/library/view/temporary-access/</a>.</b></p>
</div>
<div id="m_1978099513469208302course-website" style="font-size:14px">
<h1 style="font-size:26px"><span>9</span> Course Website</h1>
<p>The course website for QSB 282 is available through <a href="https://catcourses.ucmerced.edu/courses/22061" target="_blank">
UC Merced CatCourses</a></p>
</div>
<div id="m_1978099513469208302course-policies" style="font-size:14px">
<h1 style="font-size:26px"><span>10</span> Course Policies</h1>
<div id="m_1978099513469208302assignment-and-lateness-policy">
<h2 style="font-size:20px"><span>10.1</span> Assignment and Lateness Policy</h2>
<p>All assignments (including lab assignments, discussion write-ups and the final course project proposal, write-up and oral presentation) must be completed by end of term in order to achieve a passing grade of B- or better in QSB 282. Late assignments
 receive full credit.</p>
</div>
<div id="m_1978099513469208302attendance-policy">
<h2 style="font-size:20px"><span>10.2</span> Attendance Policy</h2>
<blockquote>
<p><i>Showing up is 80 percent of life</i> – Woody Allen, <a href="http://quoteinvestigator.com/2013/06/10/showing-up/#note-6553-1" target="_blank">
via Marshall Brickman</a></p>
</blockquote>
<p><b>Attendance is mandatory in labs and discussions.</b> A roll call will be taken and contribute to your final grade in the class. I recognize that the experience students bring to this class is highly variable, and that at least
 some parts of lab assignments may be easy to complete and not require any help. Nonetheless, I ask you to please help each other in lab to complete the lab assignments, because we humans have evolved to best learn new techniques and new languages socially,
 in groups. If you find yourself often in the helper role, then please consider this class to be part of your graduate pedagogical training…. and thank you in advance.</p>
<p>Absences from lab and discussion will be excused with full credit as follows:</p>
<ol>
<li>
<p>You may have a planned excused absence (or arranged permanent excuse for lateness or leaving early) related to professional obligations (such as conference attendance), course conflicts or state or federally-accepted religious observances. Please
 contact me by email in advance to be excused.</p>
</li><li>
<p>You may have an unplanned absence due to a serious illness or crisis. Please contact me by email to be excused.</p>
</li></ol>
<p>Unexcused late attendance will be worth 80% of on-time attendance.</p>
</div>
<div id="m_1978099513469208302covid-policy">
<h2 style="font-size:20px"><span>10.3</span> COVID Policy</h2>
<p>We are all humans stuck in the middle of a pandemic. I will maintain reasonable flexibility in the face of the ongoing challenges posed by this, in accordance with campus policies. Please contact me if you need help.</p>
</div>
<div id="m_1978099513469208302grading-policy">
<h2 style="font-size:20px"><span>10.4</span> Grading Policy</h2>
<p>Graduate students may take QSB 282 for either a letter grade or on a S/U grading basis. To achieve an S grade they must perform at the level of at least a “B” in the grading scale below, complete all assignments and the independent research project
 to a professional standard of scholarship and thoroughness.</p>
<table style="font-size:14px">
<thead>
<tr>
<th>Percentage of Final Grade</th>
<th>Assessment</th>
</tr>
</thead>
<tbody>
<tr>
<td><b>45%</b></td>
<td>lab assignments</td>
</tr>
<tr>
<td><b>10%</b></td>
<td>discussion write-ups</td>
</tr>
<tr>
<td><b>10%</b></td>
<td>attendance and participation in lab and discussion</td>
</tr>
<tr>
<td><b>35%</b></td>
<td>final project proposal, final report and oral presentation</td>
</tr>
</tbody>
</table>
<p>This table shows the minimum course points achieved that will guarantee the corresponding grade. Information on grade appeals, incompletes, etc. can be found in the UC Merced Grading Policy available from the Registrar.</p>
<table style="font-size:14px">
<thead>
<tr>
<th>Grade</th>
<th>% Total Points Achieved</th>
</tr>
</thead>
<tbody>
<tr>
<td>A-, A, A+</td>
<td>85%, 90%, 95%</td>
</tr>
<tr>
<td>B-, B, B+</td>
<td>70%, 75%, 80%</td>
</tr>
<tr>
<td>C-, C, C+</td>
<td>60%, 63%, 67%</td>
</tr>
<tr>
<td>D-, D, D+</td>
<td>50%, 53%, 57%</td>
</tr>
</tbody>
</table>
</div>
<div id="m_1978099513469208302student-disability-services">
<h2 style="font-size:20px"><span>10.5</span> Student Disability Services</h2>
<p>UC Merced is committed to make our courses accessible to all students, including students with limited mobility, impaired hearing or vision, and learning disabilities. Any student who feels they may need an accommodation based on the impact of a
 disability should contact me privately to discuss specific needs, and please also contact Disability Services at (209) 228-6996 as soon as possible to become registered and ensure that such accommodations are implemented in a timely fashion.</p>
</div>
<div id="m_1978099513469208302academic-integritycheating">
<h2 style="font-size:20px"><span>10.6</span> Academic Integrity/Cheating</h2>
<p>You may not share your worked assignments directly with other students. You may not copy homework or lab assignments from other students. Your work must be original and fulfill the professional scientific standards of publication and academic ethical
 standards commonly applied at UC Merced. You may not make up data or source references, you may not make false excuses to get extensions of time or recuse yourself from assignments, you must comply with exam and assignment instructions.
<b>You may help others on assignments but you may not provide a copy of your original work to another student in whole or in part.</b> If you violate these rules you risk losing good standing in QSB.</p>
<div style="page-break-after:always"></div>
</div>
</div>
<div id="m_1978099513469208302class-schedule" style="font-size:14px">
<h1 style="font-size:26px"><span>11</span> Class Schedule</h1>
<div><img alt="Class Calendar for QSB 282: Bioinformatics" width="1056">
<p>Class Calendar for QSB 282: Bioinformatics </p>
</div>
<div id="m_1978099513469208302week-01-0823---0827-data-science-i-workspace-for-reproducible-scientific-computing">
<h2 style="font-size:20px"><span>11.1</span> Week 01, 08/23 - 08/27: Data Science I: Workspace for Reproducible Scientific Computing</h2>
<div id="m_1978099513469208302lectures-course-intro.-intro.-to-rmarkdown-and-other-markup-languages">
<h3 style="font-size:16.040000915527344px"><span>11.1.1</span> Lectures: Course Intro., Intro. to RMarkdown and other Markup Languages</h3>
</div>
<div id="m_1978099513469208302lab-start-install-unix-rrstudio-latex-and-git">
<h3 style="font-size:16.040000915527344px"><span>11.1.2</span> Lab: Start — Install UNIX, R/RStudio, LaTeX and Git</h3>
</div>
<div id="m_1978099513469208302discussion-reproducibility-in-scientific-computing">
<h3 style="font-size:16.040000915527344px"><span>11.1.3</span> Discussion: Reproducibility in Scientific Computing</h3>
</div>
</div>
<div id="m_1978099513469208302week-02-0830---0903-data-science-ii-communicating-and-collaborating-with-rstudio-overleaf-and-git">
<h2 style="font-size:20px"><span>11.2</span> Week 02, 08/30 - 09/03: Data Science II: Communicating and Collaborating with RStudio, Overleaf and Git</h2>
</div>
<div id="m_1978099513469208302week-03-0906---0910-data-science-iii-installing-and-compiling-foss">
<h2 style="font-size:20px"><span>11.3</span> Week 03, 09/06 - 09/10: Data Science III: Installing and Compiling FOSS</h2>
</div>
<div id="m_1978099513469208302week-04-0913---0917-data-science-iv-computational-pipelines-in-unix-and-r">
<h2 style="font-size:20px"><span>11.4</span> Week 04, 09/13 - 09/17: Data Science IV: Computational Pipelines in UNIX and R</h2>
</div>
<div id="m_1978099513469208302week-05-0920---0924-data-science-v-data-integration-and-visualization-in-unix-and-r">
<h2 style="font-size:20px"><span>11.5</span> Week 05, 09/20 - 09/24: Data Science V: Data Integration and Visualization in UNIX and R</h2>
</div>
<div id="m_1978099513469208302week-06-0927---1001-bioinformatics-i-analysis-of-frequencies-and-compositions">
<h2 style="font-size:20px"><span>11.6</span> Week 06, 09/27 - 10/01: Bioinformatics I: Analysis of Frequencies and Compositions</h2>
</div>
<div id="m_1978099513469208302week-07-1004---1008-bioinformatics-ii-homology-similarity-and-evolutionary-distance">
<h2 style="font-size:20px"><span>11.7</span> Week 07, 10/04 - 10/08: Bioinformatics II: Homology, Similarity and Evolutionary Distance</h2>
<p>Final Project Proposals Due</p>
</div>
<div id="m_1978099513469208302week-08-1011---1015-bioinformatics-iii-substitution-and-score-matrices">
<h2 style="font-size:20px"><span>11.8</span> Week 08, 10/11 - 10/15: Bioinformatics III: Substitution and Score Matrices</h2>
<p>Individual Meetings to Discuss Final Projects</p>
</div>
<div id="m_1978099513469208302week-09-1018---1022-bioinformatics-iv-pairwise-and-multiple-alignment">
<h2 style="font-size:20px"><span>11.9</span> Week 09, 10/18 - 10/22: Bioinformatics IV: Pairwise and Multiple Alignment</h2>
</div>
<div id="m_1978099513469208302week-10-1025---1029-bioinformatics-v-blast-theory">
<h2 style="font-size:20px"><span>11.10</span> Week 10, 10/25 - 10/29: Bioinformatics V: BLAST Theory</h2>
</div>
<div id="m_1978099513469208302week-11-1101---1105-bioinformatics-vi-automating-genome-wide-analysis">
<h2 style="font-size:20px"><span>11.11</span> Week 11, 11/01 - 11/05: Bioinformatics VI: Automating Genome-Wide Analysis</h2>
</div>
<div id="m_1978099513469208302week-12-1108---1112-machine-learning-i-classifiers-and-motif-analysis">
<h2 style="font-size:20px"><span>11.12</span> Week 12, 11/08 - 11/12: Machine Learning I: Classifiers and Motif Analysis</h2>
</div>
<div id="m_1978099513469208302week-13-1115---1119-machine-learning-ii-distance-based-clustering-phylogeny-and-dimensionality-reduction">
<h2 style="font-size:20px"><span>11.13</span> Week 13, 11/15 - 11/19: Machine Learning II: Distance-based Clustering, Phylogeny and Dimensionality Reduction</h2>
</div>
<div id="m_1978099513469208302week-14-1122---1126-machine-learning-iii-analysis-of-location">
<h2 style="font-size:20px"><span>11.14</span> Week 14, 11/22 - 11/26: Machine Learning III: Analysis of Location</h2>
</div>
<div id="m_1978099513469208302week-15-1129---1203-machine-learning-iv-linear-models-and-experimental-designs-in-gene-expression-analysis">
<h2 style="font-size:20px"><span>11.15</span> Week 15, 11/29 - 12/03: Machine Learning IV: Linear Models and Experimental Designs in Gene Expression Analysis</h2>
</div>
<div id="m_1978099513469208302week-16-1206---1210-machine-learning-v-pathway-analysis">
<h2 style="font-size:20px"><span>11.16</span> Week 16, 12/06 - 12/10: Machine Learning V: Pathway Analysis</h2>
<p>Final Project Oral Presentations on Saturday Morning</p>
</div>
</div>
<div id="m_1978099513469208302recommended-and-supplemental-references">
<h1 style="font-size:26px"><span>12</span> Recommended and Supplemental References</h1>
<p style="font-size:14px">Please use these references to support your learning in this course. References from O’Reilly require you to sign in through its special portal at
<a href="https://www.oreilly.com/library/view/temporary-access/" target="_blank">https://www.oreilly.com/library/view/temporary-access/</a>. References through “EBookCentral” may require you to sign in by VPN to access through the library while off-campus, see
<a href="https://it.ucmerced.edu/VPN_Changeover" target="_blank">https://it.ucmerced.edu/VPN_Changeover</a>.
<b>Through these portals, all references with URLs given below are freely available.</b></p>
<div id="m_1978099513469208302computer-science-and-programming" style="font-size:14px">
<h2 style="font-size:20px"><span>12.1</span> Computer Science and Programming</h2>
<ol>
<li><i>UNIX and Perl to the Rescue!: A Field Guide for the Life Sciences (and Other Data-rich Pursuits)</i> by Drs Keith Bradnam, Michelle Gill and Ian Korf. (CUP ISBN 978-0521169820).
<a href="http://korflab.ucdavis.edu/Unix_and_Perl/current.pdf" target="_blank">http://korflab.ucdavis.edu/Unix_and_Perl/current.pdf</a> and other resources available at
<a href="https://rescuedbycode.com" target="_blank">https://rescuedbycode.com</a></li><li><i>Command-Line Essentials Playlist</i> by Daniel J. Barrett
<a href="https://learning.oreilly.com/playlists/6b0ba469-d706-45a0-ae95-05560a7ef529/" target="_blank">
https://learning.oreilly.com/playlists/6b0ba469-d706-45a0-ae95-05560a7ef529/</a></li><li><i>Unix Power Tools</i>, 3rd Edition by Jerry Peek, Shelley Powers, Tim O’Reilly, Mike Loukides
<a href="https://learning.oreilly.com/library/view/unix-power-tools/0596003307/" target="_blank">
https://learning.oreilly.com/library/view/unix-power-tools/0596003307/</a></li><li><i>Learning R</i> by Richard Cotton (O’Reilly Media, Inc. 978-1-4493-5710-8).
<a href="https://learning.oreilly.com/library/view/learning-r/9781449357160/" target="_blank">
https://learning.oreilly.com/library/view/learning-r/9781449357160/</a></li><li><i>Dynamic Documents with R and knitr</i>, 2nd Edition by Yihui Xie
<a href="https://learning.oreilly.com/library/view/dynamic-documents-with/9781315360706/" target="_blank">
https://learning.oreilly.com/library/view/dynamic-documents-with/9781315360706/</a></li><li><i>Regular Expressions Cookbook</i>, 2nd Edition by Jan Goyvaerts, Steven Levithan
<a href="https://learning.oreilly.com/library/view/regular-expressions-cookbook/9781449327453/" target="_blank">
https://learning.oreilly.com/library/view/regular-expressions-cookbook/9781449327453/</a></li><li><i>Understanding Computation</i>, by Tom Stuart <a href="https://learning.oreilly.com/library/view/understanding-computation/9781449330071/" target="_blank">
https://learning.oreilly.com/library/view/understanding-computation/9781449330071/</a></li><li><i>Three Ways To Learn Python Playlist</i> by Tim O’Reilly
<a href="https://learning.oreilly.com/playlists/2c6094f3-06c1-413f-aacd-a4d8c437d826/" target="_blank">
https://learning.oreilly.com/playlists/2c6094f3-06c1-413f-aacd-a4d8c437d826/</a></li><li><i>Fluent Python</i>, 2nd Edition by Luciano Ramalho <a href="https://learning.oreilly.com/library/view/fluent-python-2nd/9781492056348/" target="_blank">
https://learning.oreilly.com/library/view/fluent-python-2nd/9781492056348/</a></li></ol>
</div>
<div id="m_1978099513469208302statistics" style="font-size:14px">
<h2 style="font-size:20px"><span>12.2</span> Statistics</h2>
<ol>
<li><i>Modern Statistics for Modern Biology</i> by Susan Holmes and Wolfgang Huber (FREE BOOK AVAILABLE ONLINE)
<a href="http://web.stanford.edu/class/bios221/book/" target="_blank">http://web.stanford.edu/class/bios221/book/</a></li><li><i>Statistical Rethinking : A Bayesian Course with Examples in R and STAN</i>, 2nd Ed. by Richard McElreath
<a href="https://ebookcentral.proquest.com/lib/ucm/reader.action?docID=6133700" target="_blank">
https://ebookcentral.proquest.com/lib/ucm/reader.action?docID=6133700</a></li><li><i>Large-Scale Inference : Empirical Bayes Methods for Estimation, Testing, and Prediction</i> by Bradley Efron
<a href="https://ebookcentral.proquest.com/lib/ucm/detail.action?pq-origsite=primo&docID=585354" target="_blank">
https://ebookcentral.proquest.com/lib/ucm/detail.action?pq-origsite=primo&docID=585354</a></li><li><i>Bayesian Data Analysis</i> by Gelman et al. 3rd Edition. Available as e-book from
<a href="https://ebookcentral.proquest.com/lib/ucm/detail.action?docID=1438153" target="_blank">
https://ebookcentral.proquest.com/lib/ucm/detail.action?docID=1438153</a></li><li><i>Nonparametric Statistical Methods</i> 2nd Ed. M. Hollander, Douglas A. Wolfe and Eric Chicken.
<a href="https://ebookcentral.proquest.com/lib/ucm/detail.action?docID=1550549" target="_blank">
https://ebookcentral.proquest.com/lib/ucm/detail.action?docID=1550549</a></li><li><i>The Analysis of Biological Data</i> by Whitlock and Schluter, 2nd. Ed. The modern recommended commercial textbook</li><li><i>Biometry</i> by Sokal and Rohlf, 3rd Ed. (1995) or 4th Ed. (2012). New York. W.H. Freeman. The old-school classic.</li><li><i>Biostatistical Analysis</i> by J.H. Zar, 5nd. Ed. — Another classic with unique coverage of circular statistics and other topics.</li><li><i>An Introduction to the Bootstrap</i> by Efron and Tibshirani (1993) Chapman and Hall. Brad Efron is the inventor of the bootstrap and innovator of empirical Bayes methods, see above. This is a great learning text covering basic concepts
 of statistics from a fresh angle.</li></ol>
</div>
<div id="m_1978099513469208302data-science-and-machine-learning" style="font-size:14px">
<h2 style="font-size:20px"><span>12.3</span> Data Science and Machine Learning</h2>
<ol>
<li><i>Data Science at the Command Line</i>, 2nd Ed by Jeroen Janssens
<a href="https://learning.oreilly.com/library/view/data-science-at/9781492087908/" target="_blank">
https://learning.oreilly.com/library/view/data-science-at/9781492087908/</a></li><li><i>Hands-On Machine Learning with Scikit-Learn and TensorFlow</i> by Aurélien Géron
<a href="https://learning.oreilly.com/library/view/hands-on-machine-learning/9781491962282/" target="_blank">
https://learning.oreilly.com/library/view/hands-on-machine-learning/9781491962282/</a></li><li><i>An Introduction to Statistical Learning with Applications in R</i> by James, Witten Hastie, and Tibshirani, Springer,
<a href="https://www.springer.com/us/book/9781461471370" target="_blank">https://www.springer.com/us/book/9781461471370</a></li><li><i>The Elements of Statistical Learning: Data Mining, Inference, and Prediction</i> by Hastie, Tibshirani, and Friedman, 2nd. Ed. Springer, available for free at
<a href="http://statweb.stanford.edu/~tibs/ElemStatLearn/" target="_blank">http://statweb.stanford.edu/~tibs/ElemStatLearn/</a></li><li><i>R for Data Science</i> by Hadley Wickham; Garrett Grolemund (O’Reilly Media, Inc. 978-1-4919-1039-9)
<a href="https://learning.oreilly.com/library/view/r-for-data/9781491910382/" target="_blank">
https://learning.oreilly.com/library/view/r-for-data/9781491910382/</a></li><li><i>Fundamentals of Data Visualization</i> by Claus Wilke (O’Reilly Media, Inc., 978-1-4920-3108-6)
<a href="https://learning.oreilly.com/library/view/fundamentals-of-data/9781492031079/" target="_blank">
https://learning.oreilly.com/library/view/fundamentals-of-data/9781492031079/</a></li></ol>
</div>
<div id="m_1978099513469208302bioinformatics-and-molecular-evolution">
<h2 style="font-size:20px"><span>12.4</span> Bioinformatics and Molecular Evolution</h2>
<ol>
<li style="font-size:14px"><i>Sequence - Evolution - Function: Computational Approaches in Comparative Genomics</i> by Koonin and Galperin (2003) — <a href="https://www.ncbi.nlm.nih.gov/books/NBK20259/" target="_blank">https://www.ncbi.nlm.nih.gov/books/NBK20259/</a></li><li style="font-size:14px">Sections from online help resources of NCBI such as the NCBI Handbook, Tutorials, and Howtos available at
<a href="http://www.ncbi.nlm.nih.gov/guide/training-tutorials/" target="_blank">http://www.ncbi.nlm.nih.gov/guide/training-tutorials/</a></li><li style="font-size:14px"><i>Bioinformatics Data Skills</i> by Vince Buffalo
<a href="https://learning.oreilly.com/library/view/bioinformatics-data-skills/9781449367480/" target="_blank">
https://learning.oreilly.com/library/view/bioinformatics-data-skills/9781449367480/</a></li><li style="font-size:14px"><i>BLAST</i> by Ian Korf, Mark Yandell, and Joseph Bedell —
<a href="https://learning.oreilly.com/library/view/blast/0596002998/" target="_blank">
https://learning.oreilly.com/library/view/blast/0596002998/</a></li><li style="font-size:14px"><i>R Bioinformatics Cookbook</i> by Dan MacLean
<a href="https://learning.oreilly.com/library/view/r-bioinformatics-cookbook/9781789950694/" target="_blank">
https://learning.oreilly.com/library/view/r-bioinformatics-cookbook/9781789950694/</a></li><li style="font-size:14px"><i>Mastering Python for Bioinformatics</i> by Ken Youens-Clark
<a href="https://learning.oreilly.com/library/view/mastering-python-for/9781098100872/" target="_blank">
https://learning.oreilly.com/library/view/mastering-python-for/9781098100872/</a></li><li style="font-size:14px"><i>Bioinformatics and Molecular Evolution</i> by Higgs and Atwood (Blackwell; ISBN978140510683)</li><li style="font-size:14px"><i>Biological Sequence Analysis</i> by Durbin et al. (Cambridge; ISBN9780521629713)</li><li style="font-size:14px"><i>An Introduction to Bioinformatics Algorithms</i> by Jones and Pevzner (MIT Press; ISBN9780262101066)</li></ol>
</div>
</div>
</div>
</div>

</div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font size="2"><span style="font-family:arial,sans-serif">Jason (Jay) Sexton</span></font></div><div><font size="2"><span style="font-family:arial,sans-serif">(he/him/his)<br></span></font></div><div dir="ltr"><font size="2"><span style="font-family:arial,sans-serif">Associate Professor<br>Department of Life and Environmental Sciences<br>University of California, Merced<br></span></font></div><div><font size="2"><span style="font-family:arial,sans-serif">231 Science and Engineering Building 1<br></span></font></div><div dir="ltr"><font size="2"><span style="font-family:arial,sans-serif"><a href="mailto:jsexton2@ucmerced.edu" target="_blank">jsexton2@ucmerced.edu</a><br><a href="http://sextonlab.ucmerced.edu/" target="_blank">http://sextonlab.ucmerced.edu/</a><br></span></font></div><div dir="ltr"><br><font size="2"><span style="font-family:arial,sans-serif"></span></font></div><div dir="ltr"><font size="2"><span style="font-family:arial,sans-serif">


















</span></font><p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"Calibri",sans-serif"><font size="2"><span style="font-family:arial,sans-serif">---Nature does not hurry, yet everything is accomplished ~
Lao Tzu---</span></font></p><font size="2"><span style="font-family:arial,sans-serif">

</span><span style="font-family:arial,sans-serif">

</span></font><p class="MsoNormal" style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"Calibri",sans-serif"><font size="2"><span style="font-family:arial,sans-serif">---We are quite literally air, water, soil, energy and other
living creatures ~ David Suzuki---</span></font></p>





</div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>